搜索_华为云

训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练脚本存放目录说明不同模型推荐的参数与NPU卡数设置训练tokenizer文件说明父主题： Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）
训练作业 - AI开发平台ModelArts
训练作业 - AI开发平台ModelArts

查询训练作业版本详情删除训练作业版本查询训练作业版本列表创建训练作业版本停止训练作业版本更新训练作业描述删除训练作业获取训练作业日志的文件名查询预置算法查询训练作业日志父主题：训练管理（旧版）

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版）
实例故障 - AI开发平台ModelArts
实例故障 - AI开发平台ModelArts

创建Notebook失败，查看事件显示JupyterProcessKilled 创建Notebook实例后无法打开页面，如何处理？使用pip install时出现“没有空间”的错误出现“save error”错误，可以运行代码，但是无法保存出现ModelArts.6333错误，如何处理？打开Notebook实

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
Lite Cluster - AI开发平台ModelArts
Lite Cluster - AI开发平台ModelArts

Lite Cluster 资源池创建失败的原因与解决方法？ Cluster资源池节点故障如何定位特权池信息数据显示均为0%如何解决？重置节点后无法正常使用？

帮助中心 > AI开发平台ModelArts > 故障排除
查询模型runtime - AI开发平台ModelArts

状态码： 200 表4 响应Body参数参数参数类型描述 count Integer 不分页的情况下符合查询条件的总数量。 total_count Integer 当前查询结果的数量，不设置offset、limit查询参数时，count与total相同。 engine_runtimes

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
制作自定义镜像用于ModelArts Standard - AI开发平台ModelArts

制作自定义镜像用于ModelArts Standard 自定义镜像使用场景 ModelArts支持的预置镜像列表制作自定义镜像用于创建Notebook 制作自定义镜像用于训练模型制作自定义镜像用于推理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

timeout:939 callbacks suppressed 华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败裸金属服务器Euler

帮助中心 > AI开发平台ModelArts > 故障排除
历史待下线案例 - AI开发平台ModelArts

历史待下线案例使用AI Gallery的订阅算法实现花卉识别使用ModelArts PyCharm插件调试训练ResNet50图像分类模型示例：从 0 到 1 制作自定义镜像并用于训练（PyTorch+CPU/GPU）示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU）

帮助中心 > AI开发平台ModelArts > 最佳实践
日志提示“no socket interface found” - AI开发平台ModelArts

EOUT，因此会导致通信速度慢且不稳定，最后造成IB通信断连，偶发上述现象。原因2：NCCL_SOCKET_IFNAME设置错误。当用户的NCCL版本低于2.14时，则需要手动设置NCCL_SOCKET_IFNAME环境变量。处理方法针对原因1，需要在代码中补充如下环境变量。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
制作自定义镜像用于训练模型 - AI开发平台ModelArts

制作自定义镜像用于训练模型训练作业的自定义镜像制作流程使用预置镜像制作自定义镜像用于训练模型已有镜像迁移至ModelArts用于训练模型从0制作自定义镜像用于创建训练作业（Pytorch+Ascend）从0制作自定义镜像用于创建训练作业（PyTorch+CPU/GPU）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
同步Lite Server服务器状态 - AI开发平台ModelArts

登录ModelArts管理控制台。在左侧导航栏中，选择“AI专属资源池 > 弹性节点 Server”，进入“节点”列表页面。在弹性节点Server列表中，单击的“同步”，在弹出的确认对话框中，确认信息无误，然后单击“确定”，完成同步操作。图1 同步状态父主题： Lite Server资源管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

'feat_2:0', 'feat_3': 'feat_3:0'} 不做数据集切分操作。如果选择未切分的数据集，算法将做纯训练场景；父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
训练性能测试 - AI开发平台ModelArts

<master_addr> --num_nodes <nodes> --rank <rank> <cfgs_yaml_file>：性能测试配置的yaml文件地址，如代码目录中performance_cfgs.yaml相对或绝对路径。 <model_name>：训练模型名，如qwen2-7b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练benchmark工具
【下线公告】华为云ModelArts MindStudio/ML Studio/ModelBox镜像下线公告 - AI开发平台ModelArts

无法再新建。如您有任何问题，可随时通过工单或者服务热线（4000-955-988或950808）与我们联系。常见问题下线镜像对现有用户的使用是否有影响？下线镜像对已有用户不影响，用户可以继续使用已有实例启动Notebook，但是需要注意删除实例后无法再新建实例。镜像下线后是否可以继续基于该镜像新建实例？

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告

总条数： 2394

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练脚本说明 - AI开发平台ModelArts

训练作业 - AI开发平台ModelArts

实例故障 - AI开发平台ModelArts

Lite Cluster - AI开发平台ModelArts

查询模型runtime - AI开发平台ModelArts

制作自定义镜像用于ModelArts Standard - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

历史待下线案例 - AI开发平台ModelArts

日志提示“no socket interface found” - AI开发平台ModelArts

制作自定义镜像用于训练模型 - AI开发平台ModelArts

同步Lite Server服务器状态 - AI开发平台ModelArts

使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

【下线公告】华为云ModelArts MindStudio/ML Studio/ModelBox镜像下线公告 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线