搜索_华为云

启动推理服务 - AI开发平台ModelArts

小模型如Qwen2-1.5B和Qwen2-0.5B推荐不设置该参数。 --disable-async-output-proc：关闭异步后处理特性，关闭后性能会下降。多机部署启动推理服务（可选）当单机显存无法放下模型权重时，可选用多机方式部署；多机部署方式，需要机器在同一个集

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
查找Workflow工作流 - AI开发平台ModelArts

过滤出相应的工作流。图1 属性类型单击搜索框右侧的按钮，可设置Workflow列表页需要展示的内容和展示效果。表格内容折行：默认为关闭状态。启用此功能可以让Workflow列表页中的内容在显示时自动换行。禁用此功能可截断文本，Workflow列表页中仅显示部分内容。操作

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
创建诊断任务 - AI开发平台ModelArts

源占用过大或者OOM类问题导致的notebook实例异常。 5 disable_profiling_comparison False 否关闭快慢卡算子比对。对于集群任务的profiling分析，如果存在快慢卡问题则会自动进行集群内部快慢卡的算子性能比对，包括npu侧计算的算子比

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
训练物体检测模型 - AI开发平台ModelArts

返回新版自动学习页面，单击数据标注节点的“继续运行”，然后等待工作流按顺序进入训练节点。模型将会自动进入训练，无需人工介入，训练时间相对较长，建议您耐心等待。如果关闭或退出此页面，系统仍然在执行训练操作。在“物体检测”节点中，待训练状态由“运行中”变为“运行成功”，即完成模型的自动训练。图2 运行成功

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

功能获取相关信息，存在锁死的风险。出现D+进程后可以尝试如下方法：方法1：可以根据ps -aux查到的进程号，使用kill -9强制关闭进程。 sudo kill -9 <进程ID> 方法2：如果方法1执行后无法消除D+进程，请尝试重启服务器。父主题： Lite Server

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
训练声音分类模型 - AI开发平台ModelArts

返回新版自动学习页面，单击数据标注节点的“继续运行”，然后等待工作流按顺序进入训练节点。模型将会自动进入训练，无需人工介入，训练时间相对较长，建议您耐心等待。如果关闭或退出此页面，系统仍然在执行训练操作。在“声音分类”节点中，待训练状态由“运行中”变为“运行成功”，即完成模型的自动训练。训练完成后，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现声音分类
部署推理服务 - AI开发平台ModelArts

# eagle投机对基于 https://github.com/SafeAILab/EAGLE/ 版本实现 export ENABLE_SPEC_METRIC=0 # 是否关闭投机推理的metric采集功能，关闭有助于提升投机推理性能，默认关闭如果需要使用eagle投机推理功能，需要进入

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
查看批量服务的事件 - AI开发平台ModelArts

Stopping service. - 正常服务已停止。 Service stopped. - 正常自动停止开关已关闭。 Auto-stop switched off. - 正常自动关闭功能开启，服务将在xs后停止。 Auto-stop switched on, service will be

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
投机推理使用说明 - AI开发平台ModelArts

投机推理batch上限，即当输入batch大于此值，将不进行投机推理。其使用原因是投机推理在大batch下收益会显著下降，故需要在batch过大时关闭该特性。 online --speculative-model str 小模型权重地址，目前支持相对基础模型（如llama2-13b-chat）较小的LLM模型（如llama1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
查看在线服务的事件 - AI开发平台ModelArts

Stopping service. - 正常服务已停止。 Service stopped. - 正常自动停止开关已关闭。 Auto-stop switched off. - 正常自动关闭功能开启，服务将在xs后停止。 Auto-stop switched on, service will be

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
部署模型为在线服务 - AI开发平台ModelArts

设置“升级为WebSocket”后，不支持设置“服务流量限制”。 “升级为WebSocket”参数配置，不支持修改。 “运行日志输出” - 默认关闭，在线服务的运行日志仅存放在ModelArts日志系统，在服务详情页的“日志”支持简单查询。如果开启此功能，在线服务的运行日志会输出存放

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

4卡 modelarts.pool.visual.8xlarge 8卡步骤6：清除资源 Notebook在代码调试完成及提交训练作业后就可以关闭了，减少资源扣费。当调测完成且实例处于运行状态时，单击停止；当下次调测且实例处于停止状态时，单击启动实例，随开随用。训练输出保存结构说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境
ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

--filter String 否镜像名关键字。根据镜像名关键字过滤镜像列表。 -v / --verbose Bool 否显示详细的信息开关，默认关闭。 -i / --image-id String 否查询指定镜像ID的镜像详情。 -n / --image-name String 否查询指定镜像名称的镜像详情。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

com/SafeAILab/EAGLE/ 版本实现 xport ENABLE_SPEC_METRIC=0 # 是否关闭投机推理的metric采集功能，关闭有助于提升投机推理性能，默认关闭如果需要使用eagle投机推理功能，需要进入lm_tools/spec_decode/EAGLE 文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
非分离部署推理服务 - AI开发平台ModelArts

# eagle投机对基于 https://github.com/SafeAILab/EAGLE/ 版本实现，默认开启 export ENABLE_SPEC_METRIC=0 # 是否关闭投机推理的metric采集功能，关闭有助于提升投机推理性能，默认关闭如果需要使用eagle投机推理功能，需要进入

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
训练文本分类模型 - AI开发平台ModelArts

返回新版自动学习页面，单击数据标注节点的“继续运行”，然后等待工作流按顺序进入训练节点。模型将会自动进入训练，无需人工介入，训练时间相对较长，建议您耐心等待。如果关闭或退出此页面，系统仍然在执行训练操作。在“文本分类”节点中，待训练状态由“运行中”变为“运行成功”，即完成模型的自动训练。图2 运行成功

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现文本分类
训练图像分类模型 - AI开发平台ModelArts

在新版自动学习页面，单击数据标注节点的“继续运行”按钮，然后等待工作流按顺序进入训练节点即可。模型将会自动进入训练，无需人工介入，训练时间相对较长，建议您耐心等待。如果关闭或退出此页面，系统仍然在执行训练操作。在“图像分类”节点中，待训练状态由“运行中”变为“运行成功”，即完成了模型的自动训练。训练完成后

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
非分离部署推理服务 - AI开发平台ModelArts

export USE_VOCAB_PARALLEL=1 # 是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
Standard Notebook - AI开发平台ModelArts

k使用的cuda版本？在ModelArts的Notebook中如何获取本机外网IP？ ModelArts的Notebook有代理吗？如何关闭？在ModelArts的Notebook中内置引擎不满足使用需要时，如何自定义引擎IPython Kernel？在ModelArts的Notebook中如何将git

帮助中心 > AI开发平台ModelArts > 常见问题
Lite Cluster&Server介绍 - AI开发平台ModelArts

支持节点新进入集群，默认启用准入检测，以能够拉起真实的GPU/NPU检测任务支持集群扩容时，扩容的节点默认开启准入检测，该准入检测也可关闭，以提升拉起真实的GPU/NPU检测任务成功率。父主题：功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍

总条数： 471

上一页
1
...
10
11
12
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

启动推理服务 - AI开发平台ModelArts

查找Workflow工作流 - AI开发平台ModelArts

创建诊断任务 - AI开发平台ModelArts

训练物体检测模型 - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

训练声音分类模型 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

查看批量服务的事件 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

查看在线服务的事件 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

训练文本分类模型 - AI开发平台ModelArts

训练图像分类模型 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

Standard Notebook - AI开发平台ModelArts

Lite Cluster&Server介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线