搜索_华为云

分布式模型训练 - AI开发平台ModelArts

分布式模型训练分布式训练功能介绍创建单机多卡的分布式训练（DataParallel）创建多机多卡的分布式训练（DistributedDataParallel）示例：创建DDP分布式训练（PyTorch+GPU）示例：创建DDP分布式训练（PyTorch+NPU）父主题：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
批量删除标注团队成员 - AI开发平台ModelArts

参数类型描述 error_code String 操作失败的错误码。 error_msg String 操作失败的错误信息。 results Array of BatchResponse objects 批量删除标注团队成员的结果。 success Boolean 操作是否执行成功。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建团队标注任务 - AI开发平台ModelArts

描述 auto_sync_dataset 否 Boolean 团队标注任务的标注结果是否自动同步至数据集。可选值如下： true：团队标注任务的标注结果自动同步至数据集（默认值） false：团队标注任务的标注结果不自动同步至数据集 data_sync_type 否 Integer

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建工作流定时调度 - AI开发平台ModelArts

WorkflowSchedulePolicies 参数是否必选参数类型描述 on_failure 否 String 定时调度策略中的标记，失败时触发。 on_running 否 String 定时调度策略中的标记，running时触发。响应参数状态码： 201 表4 响应Body参数参数参数类型描述

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练的数据集预处理说明训练的权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908）
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练的数据集预处理说明训练的权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）
创建API - AI开发平台ModelArts
创建API - AI开发平台ModelArts

-Token的值）。表3 请求Body参数参数是否必选参数类型描述 workspace_id 否 String 工作空间id。 support_app_code 否 Boolean 是否支持APP CODE。 auth_type 否 String API的认证方式。枚举值如下：

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，VS Code打开后未进行远程连接 - AI开发平台ModelArts

如下则网络异常，请切换代理或使用其他网络。操作完成后再次执行搜索，若显示如下则网络正常，请回到ModelArts控制台界面再次单击界面上的“VS Code接入”按钮。方法二：出现如下图报错，是由于VS Code版本过低，建议升级VS Code版本为1.57.1或者最新版。原因分析二

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练的数据集预处理说明训练中的权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）
CodeLab - AI开发平台ModelArts
CodeLab - AI开发平台ModelArts

CodeLab 如何将git clone的py文件变为ipynb文件 Notebook里面运行的实例，如果重启，数据集会丢失么？ Jupyter可以安装插件吗？是否支持在CodeLab中使用昇腾的卡进行训练？如何在CodeLab上安装依赖？父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
训练脚本说明参考 - AI开发平台ModelArts

训练脚本说明参考训练启动脚本说明和参数配置训练的数据集预处理说明训练中的权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909）
模型训练 - AI开发平台ModelArts
模型训练 - AI开发平台ModelArts

训练？自动学习项目中，如何进行增量训练？自动学习训练后的模型是否可以下载？自动学习为什么训练失败？自动学习模型训练图片异常？自动学习使用子账号单击开始训练出现错误Modelarts.0010 自动学习中偏好设置的各参数训练速度大概是多少自动学习声音分类预测报错ERROR:input

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
MoXing - AI开发平台ModelArts
MoXing - AI开发平台ModelArts

MoXing 使用MoXing复制数据报错如何关闭Mox的warmup Pytorch Mox日志反复输出 moxing.tensorflow是否包含整个TensorFlow，如何对生成的checkpoint进行本地Fine Tune？训练作业使用MoXing拷贝数据较慢，重复打印日志

 帮助中心 > AI开发平台ModelArts > 故障排除
部署上线 - AI开发平台ModelArts
部署上线 - AI开发平台ModelArts

部署上线自动学习中部署上线是将模型部署为什么类型的服务？父主题： Standard自动学习

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
云上迁移适配故障 - AI开发平台ModelArts

云上迁移适配故障无法导入模块训练作业日志中提示“No module named .*” 如何安装第三方包，安装报错的处理方法下载代码目录失败训练作业日志中提示“No such file or directory” 训练过程中无法找到so文件 ModelArts训练作业无法解析参数，日志报错

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
启动停止边缘节点服务实例 - AI开发平台ModelArts

（响应消息头中X-Subject-Token的值）。表3 请求Body参数参数是否必选参数类型描述 status 是 String 服务状态，取值为： running：running为启动节点实例，只有处于stopped状态的节点实例支持启动。 stopped：stop

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
在线服务鉴权 - AI开发平台ModelArts

value 否 Long 付费工作流可使用的时间值。响应参数状态码： 201 表4 响应Body参数参数参数类型描述 result String 认证结果。请求示例对在线服务进行鉴权。设置付费工作流计费周期为“day”，付费工作流可使用的时间为“100”。 POST htt

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
Standard功能介绍 - AI开发平台ModelArts

Standard数据管理 Standard开发环境 Standard模型训练 Standard模型部署 Standard资源管理 Standard支持的AI框架父主题：功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
功能咨询 - AI开发平台ModelArts
功能咨询 - AI开发平台ModelArts

功能咨询什么是自动学习？ ModelArts自动学习与ModelArts PRO的区别什么是图像分类和物体检测？自动学习和订阅算法有什么区别？父主题： Standard自动学习

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
更新工作流定时调度信息 - AI开发平台ModelArts

WorkflowSchedulePolicies 参数参数类型描述 on_failure String 定时调度策略中的标记，失败时触发。 on_running String 定时调度策略中的标记，running时触发。请求示例更新调度信息 PUT https://{endpoint}/v2

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理

总条数： 2043

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

分布式模型训练 - AI开发平台ModelArts

批量删除标注团队成员 - AI开发平台ModelArts

创建团队标注任务 - AI开发平台ModelArts

创建工作流定时调度 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

创建API - AI开发平台ModelArts

在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，VS Code打开后未进行远程连接 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

CodeLab - AI开发平台ModelArts

训练脚本说明参考 - AI开发平台ModelArts

模型训练 - AI开发平台ModelArts

MoXing - AI开发平台ModelArts

部署上线 - AI开发平台ModelArts

云上迁移适配故障 - AI开发平台ModelArts

启动停止边缘节点服务实例 - AI开发平台ModelArts

在线服务鉴权 - AI开发平台ModelArts

Standard功能介绍 - AI开发平台ModelArts

功能咨询 - AI开发平台ModelArts

更新工作流定时调度信息 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线