搜索_华为云

训练作业 - AI开发平台ModelArts
训练作业 - AI开发平台ModelArts

删除训练作业版本查询训练作业版本列表创建训练作业版本停止训练作业版本更新训练作业描述删除训练作业获取训练作业日志的文件名查询预置算法查询训练作业日志父主题：训练管理（旧版）

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

用者的偏好，最后，DPO算法还可以与其他优化算法相结合，进一步提高深度学习模型的性能。 RM奖励模型(Reward Model)：是强化学习过程中一个关键的组成部分。它的主要任务是根据给定的输入和反馈来预测奖励值，从而指导学习算法的方向，帮助强化学习算法更有效地优化策略 PPO强化学习(Proximal

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
什么是Workflow - AI开发平台ModelArts

线，这条流水线将会包含数据工程、模型算法、训练配置等。用户将会使用这条流水线在持续产生的数据中持续迭代训练，确保这条流水线生产出来的模型始终维持在一个较好的状态。图1 MLOps MLOps的整条链路需要有一个工具去承载，MLOps打通了算法开发到交付运维的全流程。和以往的开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

用者的偏好，最后，DPO算法还可以与其他优化算法相结合，进一步提高深度学习模型的性能。 RM奖励模型(Reward Model)：是强化学习过程中一个关键的组成部分。它的主要任务是根据给定的输入和反馈来预测奖励值，从而指导学习算法的方向，帮助强化学习算法更有效地优化策略 PPO强化学习(Proximal

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910）
训练作业运行失败 - AI开发平台ModelArts

自定义镜像训练作业失败定位思路使用自定义镜像创建的训练作业一直处于运行中使用自定义镜像创建训练作业找不到启动文件训练作业的监控内存指标持续升高直至作业失败订阅算法物体检测YOLOv3_ResNet18(Ascend)训练失败报错label_map.pbtxt cannot be found 训练作业训练失败报错：TypeError:

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
msprobe精度分析工具使用指导 - AI开发平台ModelArts

backends.cudnn.benchmark=False cuDNN确定性地选择算法。 torch.backends.cudnn.deterministic=True cuDNN仅使用确定性的卷积算法。工具固定（Dropout） Dropout的实质是以一定概率使得输入网络的数

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
上传数据至OBS（首次使用时需要） - AI开发平台ModelArts

ap_val.txt。下载完成后将上述3个文件数据上传至OBS桶中的imagenet21k_whole文件夹中。上传方法请参考上传数据和算法至OBS（首次使用时需要）。父主题：多机多卡

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
业务代码问题 - AI开发平台ModelArts

variable” MXNet创建kvstore时程序被阻塞，无报错日志出现ECC错误，导致训练作业失败超过最大递归深度导致训练作业失败使用预置算法训练时，训练失败，报“bndbox”错误训练作业进程异常退出训练作业进程被kill 父主题：训练作业

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
Standard Workflow - AI开发平台ModelArts

步骤以及步骤之间的关系进行定义针对工作流复用，用户可以在开发完成后将流水线固化下来，提供下次或其他人员使用，同时无需关注流水线中包含什么算法或如何实现图1 Workflow流程父主题： Standard功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

开发环境创建Notebook 使用JupyterLab打开Notebook调试代码通过VS Code远程使用Notebook实例算法管理创建算法训练模型创建生产训练作业创建调试训练作业查看训练作业日志分布式训练创建AI应用简介管理AI应用部署AI应用部署为在线服务

 帮助中心 > AI开发平台ModelArts > 成长地图
编排Workflow - AI开发平台ModelArts

以图像分类为例，阐述机器学习端到端场景的完整开发过程，主要包括数据标注、模型训练、服务部署等过程。您需要准备如下算法和数据集。准备一个图像分类算法（或者可以直接从AI Gallery搜索订阅一个“图像分类-ResNet_v1_50”算法）。准备一个图片类型的数据集，请参考准备数据集。可从AI Gallery直接

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
创建Notebook实例 - AI开发平台ModelArts

CPU算力增强型，适用于密集计算场景下运算 GPU规格 “GPU: 1*Vnt1(32GB)|CPU: 8 核 64GB”：GPU单卡规格，32GB显存，适合深度学习场景下的算法训练和调测 “GPU: 1*Tnt004(16GB)|CPU: 8核* 32GB”： GPU单卡规格，16GB显存，推理计算最佳选择，覆盖场景包括计算机视觉、视频处理、NLP等

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

load_balancer_policy 否 String 只支持在线同步服务设置后端elb转发策略，枚举值：ROUND_ROBIN(加权轮询算法)，LEAST_CONNECTIONS(加权最少连接)，SOURCE_IP(源ip算法) service_secrets 否 Array of ServiceSecret

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
ModelArts最佳实践案例列表 - AI开发平台ModelArts

ModelArts Standard模型训练案例表4 自定义算法样例列表样例镜像对应功能场景说明使用ModelArts Standard自定义算法实现手写数字识别 PyTorch 自定义算法手写数字识别使用用户自己的算法，训练得到手写数字识别模型，并部署后进行预测。从0

帮助中心 > AI开发平台ModelArts > 最佳实践
创建训练任务 - AI开发平台ModelArts

训练作业”，默认进入“训练作业”列表。单击“创建训练作业”进入创建训练作业页面。在“创建训练作业”页面，填写相关参数信息，然后单击“提交”。创建方式：选择“自定义算法”。启动方式：选择“自定义”。镜像：选择上传的自定义镜像。启动命令： cd ${MA_JOB_DIR}/demo && python

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

raining-project}/。如果报错路径为训练数据路径，需要在以下两个地方完成适配，具体适配方法请参考自定义算法适配章节的输入输出配置部分：在创建算法时，您需要在输入路径配置中设置代码路径参数，默认为“data_url”。您需要在训练代码中添加超参，默认为“data

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
创建训练任务 - AI开发平台ModelArts

训练作业”，默认进入“训练作业”列表。单击“创建训练作业”进入创建训练作业页面。在“创建训练作业”页面，填写相关参数信息，然后单击“提交”。创建方式：选择“自定义算法”。启动方式：选择“自定义”。镜像：选择上传的自定义镜像。启动命令： ln -s /home/ma-user/work/coco /home/ma-user/coco

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

spawn命令启动训练作业。创建训练作业的关键参数如表1所示。表1 创建训练作业（预置框架）参数名称说明创建方式选择“自定义算法”。启动方式选择“预置框架”，引擎选择“PyTorch”，PyTorch版本根据训练要求选择。代码目录选择OBS桶中训练code文

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
AI Gallery功能介绍 - AI开发平台ModelArts

Gallery为零基础开发者，提供无代码开发工具，快速推理、部署模型；为具备基础代码能力的开发者，AI Gallery将复杂的模型、数据及算法策略深度融合，构建了一个高效协同的模型体验环境，让开发者仅需几行代码即可调用任何模型，大幅度降低了模型开发门槛。充足澎湃算力，最佳实践算力推荐方案，提升实践效率和成本

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

-s / --service String 否注册镜像的服务类型，NOTEBOOK或者MODELBOX，默认是NOTEBOOK。可以输入多个值，如-s NOTEBOOK -s MODELBOX。 -rs / --resource-category String 否注册镜像能够使用的资源类型，默认是CPU和GPU。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考

总条数： 315

上一页
1
...
9
10
11
...
16
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练作业 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

什么是Workflow - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

训练作业运行失败 - AI开发平台ModelArts

msprobe精度分析工具使用指导 - AI开发平台ModelArts

上传数据至OBS（首次使用时需要） - AI开发平台ModelArts

业务代码问题 - AI开发平台ModelArts

Standard Workflow - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

编排Workflow - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

ModelArts最佳实践案例列表 - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

AI Gallery功能介绍 - AI开发平台ModelArts

ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线