搜索_华为云

训练作业调测 - AI开发平台ModelArts

训练作业调测使用SDK调测单机训练作业使用SDK调测多机分布式训练作业父主题：训练作业

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
停止训练作业版本 - AI开发平台ModelArts

停止训练作业版本功能介绍停止训练作业。此接口为异步接口，作业状态请通过查询训练作业列表和查询训练作业版本详情接口获取。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
创建训练实验 - AI开发平台ModelArts

表6 TrainingExperimentStatistic 参数参数类型描述 job_count Integer 当前实验下的训练作业总个数。请求示例创建实验。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
模型训练 - AI开发平台ModelArts
模型训练 - AI开发平台ModelArts

模型训练自动学习训练作业失败父主题：自动学习

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习
删除训练作业版本 - AI开发平台ModelArts

删除训练作业版本功能介绍删除训练作业一个版本。此接口为异步接口，作业状态请通过查询训练作业列表和查询训练作业版本详情接口获取。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
使用SDK调测单机训练作业 - AI开发平台ModelArts

train_instance_type：必选参数，训练实例类型，这里指定'local'即为在notebook中进行训练。 train_instance_count：必选参数，训练使用的worker个数，单机训练时为1，训练作业只在当前使用的notebook中运行。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
查询训练作业日志 - AI开发平台ModelArts

查询训练作业日志功能介绍按行来查询训练作业日志详细信息。 URI GET /v1/{project_id}/training-jobs/{job_id}/versions/{version_id}/aom-log 参数说明如表1所示。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
查询训练作业列表 - AI开发平台ModelArts

最小值：1 pool_id String 训练作业选择的资源池ID。 flavor_detail flavor_detail object 训练作业、算法的规格信息。表45 flavor_detail 参数参数类型描述 flavor_type String 资源规格的类型。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
更新训练作业描述 - AI开发平台ModelArts

更新训练作业描述功能介绍更新训练作业的描述。 URI PUT /v1/{project_id}/training-jobs/{job_id} 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
查看训练作业标签 - AI开发平台ModelArts

查看训练作业标签通过给训练作业添加标签，可以标识云资源，便于快速搜索训练作业。在ModelArts管理控制台的左侧导航栏中选择“模型训练 > 训练作业”。在训练作业列表中，单击作业名称进入训练作业详情页面。在训练作业详情页面，单击“标签”页签查看标签信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
查询训练作业版本详情 - AI开发平台ModelArts

查询训练作业版本详情功能介绍根据作业ID查看指定的训练作业详情。 URI GET /v1/{project_id}/training-jobs/{job_id}/versions/{version_id} 参数说明如表1所示。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
使用预置算法训练时，训练失败，报“bndbox”错误 - AI开发平台ModelArts

使用预置算法训练时，训练失败，报“bndbox”错误问题现象使用预置算法创建训练作业，训练失败，日志中出现如下报错。 KeyError: 'bndbox' 原因分析用于训练的数据集中，使用了“非矩形框”标注。而预置使用算法不支持“非矩形框”标注的数据集。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
查看训练作业详情 - AI开发平台ModelArts

在“训练作业”列表中，单击作业名称，进入训练作业详情页。在训练作业详情页的左侧，可以查看此次训练作业的基本信息和算法配置的相关信息。训练作业基本信息表1 训练作业基本信息参数说明 “作业ID” 训练作业唯一标识。 “作业状态” 训练作业状态。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
查看训练作业事件 - AI开发平台ModelArts

可能原因是跨区域算法同步或者创建共享存储超时训练作业已排队，正在等待资源分配训练作业排队失败训练作业开始运行训练作业运行成功训练作业运行失败训练作业被抢占系统检测到您的作业疑似卡死，请及时前往作业详情界面查看并处理训练作业已重启训练作业已被手动终止训练作业已被终止

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
查看训练作业日志 - AI开发平台ModelArts

其他AI引擎的日志都包含在普通日志中，无法区分。训练日志的时效性从日志产生的时效性上可以分为以下3种情况：实时日志：训练作业实时运行时产生，在ModelArts训练作业详情页面上可以查看。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
终止训练作业 - AI开发平台ModelArts

node_count Integer 训练作业选择的资源副本数。 pool_id String 训练作业选择的资源池ID。 flavor_detail FlavorDetail object 训练作业、算法的规格信息（该字段只有公共资源池存在）。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
删除训练作业 - AI开发平台ModelArts

training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。请求参数无响应参数无请求示例如下以删除uuid为3faf5c03-aaa1-4cbe-879d-24b05d997347的训练作业为例。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
训练作业 - AI开发平台ModelArts
训练作业 - AI开发平台ModelArts

训练作业创建训练作业训练作业调测查询训练作业列表查询训练作业详情更新训练作业描述删除训练作业终止训练作业查询训练日志查询训练作业的运行指标父主题：训练管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理
设置断点续训练 - AI开发平台ModelArts

在创建训练作业时，设置训练“输出”参数为“train_url”，在指定的训练输出的数据存储位置中保存Checkpoint，且“预下载至本地目录”选择“下载”。选择预下载至本地目录时，系统在训练作业启动前，自动将数据存储位置中的Checkpoint文件下载到训练容器的本地目录。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
更新训练作业描述 - AI开发平台ModelArts

training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理

总条数： 2639

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练作业调测 - AI开发平台ModelArts

停止训练作业版本 - AI开发平台ModelArts

创建训练实验 - AI开发平台ModelArts

模型训练 - AI开发平台ModelArts

删除训练作业版本 - AI开发平台ModelArts

使用SDK调测单机训练作业 - AI开发平台ModelArts

查询训练作业日志 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

更新训练作业描述 - AI开发平台ModelArts

查看训练作业标签 - AI开发平台ModelArts

查询训练作业版本详情 - AI开发平台ModelArts

使用预置算法训练时，训练失败，报“bndbox”错误 - AI开发平台ModelArts

查看训练作业详情 - AI开发平台ModelArts

查看训练作业事件 - AI开发平台ModelArts

查看训练作业日志 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

删除训练作业 - AI开发平台ModelArts

训练作业 - AI开发平台ModelArts

设置断点续训练 - AI开发平台ModelArts

更新训练作业描述 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线