搜索_华为云

启动推理服务 - AI开发平台ModelArts

不使用beam_search场景下，n取值建议为1≤n≤10。如果n>1时，必须确保不使用greedy_sample采样。也就是top_k > 1; temperature > 0。使用beam_search场景下，n取值建议为1<n≤10。如果n=1，会导致推理请求失败。说明： n建议取值不超过10，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

供了一系列的优化技术，如模型切分、梯度累积等，可以帮助用户更好地利用多个节点进行训练。各个模型选用加速框架表1 模型加速框架建议表序号模型参数量文本序列长度优化工具(Deepspeed&Accelerator) 0 小于4B cutoff_len=4096 Deepspeed-ZeRO-0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
将模型部署为批量推理服务 - AI开发平台ModelArts

输入数据为图片时，建议单张图片小于12MB。输入数据格式为csv时，建议不要包含中文。如需使用中文，请将文件编码格式设置为UTF-8编码。您可以使用代码方式转换文件编码格式，也可以将csv文件用记事本方式打开，在另存为弹出的窗口页面设置编码格式。输入数据格式为csv时，建议文件大小不超过12MB。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
在线服务预测报错ModelArts.4302 - AI开发平台ModelArts

due to connection refused. " 出现该报错有两种情况：流量超过了模型的处理能力。可以考虑降低流量或者增加模型实例数量。镜像自身有问题。需要单独运行镜像确保镜像本身能正确提供服务。 "error_msg"："Due to self protection,

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

decode byte 0xa4 in position 324: illegal multibyte sequence”报错。粘贴完代码后，建议检查代码文件是否出现中文注释变为乱码的情况，如果出现该情况请将编辑器改为utf-8格式后再粘贴代码。在本地电脑中创建训练脚本“train

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

出现此问题后，系统将自动重启Notebook，来修复实例崩溃的问题。此时只是解决了崩溃问题，如果重新运行训练代码仍将失败。如果您需要解决“内存不够”的问题，建议您创建一个新的Notebook，使用更高规格的资源池，比如专属资源池来运行此训练代码。已经创建成功的Notebook不支持选用更高规格的资源规格进行扩容。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
创建Notebook实例 - AI开发平台ModelArts

同，价格详情请参见产品价格详情。当您不需要使用Notebook时，建议停止Notebook，避免产生不必要的费用。创建Notebook时，如果选择使用云硬盘EVS存储配置，实例不删除，云硬盘EVS会一直收费，建议及时停止并删除Notebook，避免产品不必要的费用。在创建No

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
分离部署推理服务 - AI开发平台ModelArts

2048"，服务会在启动时测算这些输入长度数据的执行时间，该数量会影响服务启动时间，建议不超过10个 --profile-out-len：profiling的输出长度，默认"4,16,64,128"，服务会在启动时测算这些输出长度数据的执行时间，该数量会影响服务启动时间，建议不超过5个 --profile-

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
推理精度测试 - AI开发平台ModelArts

推理精度测试本章节介绍如何进行推理精度测试，建议在Notebook的JupyterLab中另起一个Terminal，进行推理精度测试。若需要在生产环境中进行推理精度测试，请通过调用接口的方式进行测试。 Step1 执行精度测试精度测试需要数据集进行测试。推荐公共数据集mmlu

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
非分离部署推理服务 - AI开发平台ModelArts

不使用beam_search场景下，n取值建议为1≤n≤10。如果n>1时，必须确保不使用greedy_sample采样。也就是top_k > 1; temperature > 0。使用beam_search场景下，n取值建议为1<n≤10。如果n=1，会导致推理请求失败。说明： n建议取值不超过10，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
权限管理 - AI开发平台ModelArts
权限管理 - AI开发平台ModelArts

其进行细粒度的权限配置，以达到精细化资源、权限管理之目的。这类特性在大型企业用户的使用场景下很常见，但对个人用户则显得复杂而意义不足，所以建议个人用户在使用ModelArts时，参照配置访问授权来进行初始权限设置。您是否需要阅读本文档？如果下述问题您的任何一个回答为“是”，则需要阅读此文档

 帮助中心 > AI开发平台ModelArts > 产品介绍
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

不使用beam_search场景下，n取值建议为1≤n≤10。如果n>1时，必须确保不使用greedy_sample采样。也就是top_k > 1; temperature > 0。使用beam_search场景下，n取值建议为1<n≤10。如果n=1，会导致推理请求失败。说明： n建议取值不超过10，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
投机推理使用说明 - AI开发平台ModelArts

offline speculative_draft_tensor_parallel_size int 小模型所使用的设备数量，由于小模型通常较小，所以此处建议设置为1，如果使用eagle作为小模型，此处必须设置为1 offline speculative_disable_by_batch_size

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
管理训练容器环境变量 - AI开发平台ModelArts

“MA_NUM_HOSTS=4” VC_TASK_INDEX 当前容器索引，容器从0开始编号。单机训练的时候，该字段无意义。在多机作业中，用户可以根据这个值来确定当前容器运行的算法逻辑。 “VC_TASK_INDEX=0” VC_WORKER_NUM 训练作业使用的实例数量。 “VC_WORKER_NUM=4”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
创建训练任务 - AI开发平台ModelArts

创建训练任务调试代码创建训练任务之前，建议先调试代码。由于Notebook的/cache目录只能支持500G的存储，超过后会导致实例重启，ImageNet数据集大小超过该限制，因此建议用线下资源调试、或用小批量数据集在Notebook调试（Notebook调试方法与使用No

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
在ModelArts的Notebook中使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

run”中，修改“log_dir”参数，并新增“checkpoint_path”参数。其中“log_dir”参数建议设置为一个新的目录，“checkpoint_path”参数设置为上一次训练结果输出路径，如果是OBS目录，路径填写时建议使用“obs://”开头。如果标注数据中的标签发生了变化，在运行“mox.run”前先执行如果标签发生变化的操作。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
部署推理服务 - AI开发平台ModelArts

不使用beam_search场景下，n取值建议为1≤n≤10。如果n>1时，必须确保不使用greedy_sample采样。也就是top_k > 1; temperature > 0。使用beam_search场景下，n取值建议为1<n≤10。如果n=1，会导致推理请求失败。说明： n建议取值不超过10，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
通过Token认证的方式访问在线服务 - AI开发平台ModelArts

服务发起预测请求：方式一：使用图形界面的软件进行预测（以Postman为例）。Windows系统建议使用Postman。方式二：使用curl命令发送预测请求。Linux系统建议使用curl命令。方式三：使用Python语言发送预测请求。方式四：使用Java语言发送预测请求。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

权限清单权限表1 管理模型所需权限业务场景依赖的服务依赖策略项支持的功能配置建议管理模型 ModelArts modelarts:model:* 创建、删除、查看、导入AI模型。建议配置。仅在严格授权模式开启后，需要显式配置左侧权限。 SWR SWR Admin SWR

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
语言模型推理性能测试 - AI开发平台ModelArts

多个，如 128 128 2048 2048，数量需和--output-tokens的数量对应。 --output-tokens：输出长度，支持多个，如 128 2048 128 2048，数量需和--prompt-tokens的数量对应。 --benchmark-csv：结果保

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务性能评测

总条数： 911

上一页
1
2
3
4
5
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

启动推理服务 - AI开发平台ModelArts

各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

将模型部署为批量推理服务 - AI开发平台ModelArts

在线服务预测报错ModelArts.4302 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

权限管理 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

在ModelArts的Notebook中使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

通过Token认证的方式访问在线服务 - AI开发平台ModelArts

给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线