搜索_华为云

预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

Step4 开启训练故障自动重启功能创建训练作业时，可开启自动重启功能。当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图2 开启故障重启断点续训练是通过checkpoi

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910）
训练图像分类模型 - AI开发平台ModelArts

明模型效果较好。同一个自动学习项目可以训练多次，每次训练会注册一个新的模型版本。如第一次训练版本号为“0.0.1”，下一个版本为“0.0.2”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后，再执行模型部署的操作。父主题：使用自动学习实现图像分类

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
更新训练作业描述 - AI开发平台ModelArts

名称。 training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。请求参数表2 请求Body参数参数是否必选参数类型描述 description 否 String 对训练作业的描述，默认为“NULL”，字符串的长度限制为[0, 256]。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
创建训练作业标签 - AI开发平台ModelArts

创建训练作业标签功能介绍创建训练作业标签，支持批量添加，当添加的标签key已存在，则覆盖该标签的value。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
创建训练作业 - AI开发平台ModelArts

job_id Long 训练作业的ID。 job_name String 训练作业的名称 status Int 训练作业的运行状态，详细作业状态列表请查看作业状态参考。 create_time Long 训练作业的创建时间，时间戳格式。 version_id Long 训练作业的版本ID。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
创建训练作业版本 - AI开发平台ModelArts

job_id Long 训练作业的ID。 job_name String 训练作业的名称 status Int 训练作业的运行状态，详细作业状态列表请参见作业状态参考。 create_time Long 训练作业的创建时间，时间戳格式。 version_id Long 训练作业的版本ID。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
在ModelArts中训练好后的模型如何获取？ - AI开发平台ModelArts

在ModelArts中训练好后的模型如何获取？使用自动学习产生的模型只能在ModelArts上部署上线，无法下载至本地使用。使用自定义算法或者订阅算法训练生成的模型，会存储至用户指定的OBS路径中，供用户下载。父主题： Standard模型训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
OOM导致训练作业失败 - AI开发平台ModelArts

OOM导致训练作业失败问题现象因为OOM导致的训练作业失败，会有如下几种现象。错误码返回137，如下图所示。 Modelarts Service Log Trainina end with return code: 137 Modelarts Service Log]handle

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
查询训练作业标签 - AI开发平台ModelArts

查询训练作业标签功能介绍查询训练作业标签。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/trainJob/{training_job_id}/tags

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
停止训练作业版本 - AI开发平台ModelArts

停止训练作业版本功能介绍停止训练作业。此接口为异步接口，作业状态请通过查询训练作业列表和查询训练作业版本详情接口获取。 URI POST /v1/{project_id}/training-jobs/{job_id}/versions/{version_id}/stop 参数说明如表1所示。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
删除训练作业标签 - AI开发平台ModelArts

删除训练作业标签功能介绍删除训练作业标签，支持批量删除。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI DELETE /v2/{project_id}/trai

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
外网访问限制 - AI开发平台ModelArts

外网访问限制日志提示“ Network is unreachable” 运行训练作业时提示URL连接超时父主题：训练作业

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
查询训练作业日志 - AI开发平台ModelArts

查询训练作业日志功能介绍按行来查询训练作业日志详细信息。 URI GET /v1/{project_id}/training-jobs/{job_id}/versions/{version_id}/aom-log 参数说明如表1所示。表1 路径参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
删除训练作业版本 - AI开发平台ModelArts

删除训练作业版本功能介绍删除训练作业一个版本。此接口为异步接口，作业状态请通过查询训练作业列表和查询训练作业版本详情接口获取。 URI DELETE /v1/{project_id}/training-jobs/{job_id}/versions/{version_id} 参数说明如表1所示。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
训练迁移快速入门案例 - AI开发平台ModelArts

见容器环境搭建。训练代码迁移前提条件要迁移的训练任务代码在GPU上多次训练稳定可收敛。训练业务代码和数据，应该确保在GPU环境中能够运行，并且训练任务有稳定的收敛效果。本文只针对基于PyTorch的训练代码迁移。此处假设用户使用基于PyTorch的训练代码进行迁移。其他的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
模型训练 - 好望商城
模型训练 - 好望商城

机。在首页导航栏，进入“模型训练”页面（选择摄像机型号后，模型训练自动解锁），单击“华为训练云服务”进入ModelArts模型训练平台。如果开发者有自己训练好的模型，不需要进入该步骤。其中， ModelArts是面向开发者的一站式AI开发平台，属于华为云解决方案，需要按照华为云市场要求进行注册与使用。

帮助中心 > 好望商城 > 帮助中心 > 开发者指南 > 一站式开发平台使用指南
更新训练作业描述 - AI开发平台ModelArts

更新训练作业描述功能介绍更新训练作业的描述。 URI PUT /v1/{project_id}/training-jobs/{job_id} 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
查询训练作业列表 - AI开发平台ModelArts

JobResponse 参数参数类型描述 kind String 训练作业类型。默认使用job。枚举值： job 训练作业。 metadata JobMetadata object 训练作业元信息。 status Status object 训练作业状态信息。创建作业无需填写。 algorithm

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

调用查询训练作业详情接口使用刚创建的训练作业返回的id查询训练作业状态。调用查询训练作业指定任务的日志（OBS链接）接口获取训练作业日志的对应的obs路径。调用查询训练作业指定任务的运行指标接口查看训练作业的运行指标详情。当训练作业使用完成或不再需要时，调用删除训练作业接口删除训练作业。前提条件已获

 帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

nizer文件，具体请参见训练tokenizer文件说明。 Step2 创建预训练任务创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及上传的镜像。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。图1 选择镜像训练作业启动命令中输入： cd

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

预训练 - AI开发平台ModelArts

训练图像分类模型 - AI开发平台ModelArts

更新训练作业描述 - AI开发平台ModelArts

创建训练作业标签 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

创建训练作业版本 - AI开发平台ModelArts

在ModelArts中训练好后的模型如何获取？ - AI开发平台ModelArts

OOM导致训练作业失败 - AI开发平台ModelArts

查询训练作业标签 - AI开发平台ModelArts

停止训练作业版本 - AI开发平台ModelArts

删除训练作业标签 - AI开发平台ModelArts

外网访问限制 - AI开发平台ModelArts

查询训练作业日志 - AI开发平台ModelArts

删除训练作业版本 - AI开发平台ModelArts

训练迁移快速入门案例 - AI开发平台ModelArts

模型训练 - 好望商城

更新训练作业描述 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线