检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
2:验收中。owner发起验收任务,但并未完成验收,此时不允许发起新的验收任务,只能继续完成当前验收任务。 3:通过。团队标注任务已完成。 4:驳回。manager再次启动任务,重新修改标注和审核工作。 5:验收结果同步中。验收任务改为异步,新增验收结果同步中的状态,此时不允许发起新的验收任务,也不允
workforce_task_id 是 String 团队标注任务ID。 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 sampling_num 否 Integer 验收任务的抽样数目,与抽样比例二选一。 sampling_rate 否 Double 验收任务的抽样比例,取值范围为(0,1],与抽样数目二选一。
是否只查询数据集版本最新的任务。可选值如下: true:只查询数据集版本最新的任务 false:查询数据集版本的所有任务(默认值) return_result 否 Boolean 是否返回任务结果。可选值如下: true:返回任务结果(默认值) false:不返回任务结果 sort_by
示例:创建DDP分布式训练(PyTorch+GPU) 本文介绍三种使用训练作业来启动PyTorch DDP训练的方法及对应代码示例。 使用PyTorch预置框架功能,通过mp.spawn命令启动 使用自定义镜像功能 通过torch.distributed.launch命令启动 通过torch
String 数据处理任务ID。 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 create_version 否 Boolean 创建任务时是否同步创建一个任务版本。可选值如下: true:创建任务时同步创建一个任务版本 false:创建任务时不创建任务版本(默认值)
查询训练作业指定任务的日志(预览) 功能介绍 查询训练作业指定任务的日志(预览)。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v2/{project_
分布式Tensorflow无法使用“tf.variable” 问题现象 多机或多卡使用“tf.variable”会造成以下错误: WARNING:tensorflow:Gradient is None for variable:v0/tower_0/UNET_v7/sub_pixel/Variable:0
WorkflowSchedulePolicies 参数 参数类型 描述 on_failure String 定时调度策略中的标记,失败时触发。 on_running String 定时调度策略中的标记,running时触发。 请求示例 更新调度信息 PUT https://{endpoint}/v2/{project
查询训练作业指定任务的日志(OBS链接) 功能介绍 查询训练作业指定任务的日志(OBS临时链接,有效期5分钟),可全量查看或直接下载。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
查询训练作业指定任务的运行指标 功能介绍 查询训练作业指定任务的运行指标。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/
用户项目ID。获取方法请参见获取项目ID和名称。 task_id 是 String 数据处理任务ID。 version_id 是 String 数据处理任务的版本ID。 请求参数 无 响应参数 无 请求示例 停止数据处理任务的版本 POST https://{endpoint}/v2/{proje
抽样的样本数目。 sampling_num Integer 验收任务的抽样数目。 sampling_rate Double 验收任务的抽样比例。 score String 验收评分。 task_id String 验收任务ID。 total_sample_count Integer 总的样本数目。
训练作业重调度 当训练作业发生故障恢复时(例如进程级恢复、POD级重调度、JOB级重调度等),作业详情页面中会出现“故障恢复详情”页签,里面记录了训练作业的启停情况。 在ModelArts管理控制台的左侧导航栏中选择“模型训练 > 训练作业”。 在训练作业列表中,单击作业名称进入训练作业详情页面。
更新团队标注验收任务状态 功能介绍 在团队标注任务完成验收前确认验收范围以及是否覆盖已标注的数据,以此更新样本状态。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI PUT
该数据集是否存在正在运行(包括初始化)的一键模型上线任务。可选值如下: true:数据集存在正在运行的一键模型上线任务 false:数据集不存在正在运行的一键模型上线任务 tasks Array of RunningTask objects 任务列表。 total_count Integer 任务总数。 表4 RunningTask
导出的输出路径。 progress Float 任务当前进度百分比。 status String 任务状态。可选值如下: INIT:初始化 RUNNING:运行中 FAILED:已失败 SUCCESSED:已完成 task_id String 任务ID。 total_sample_count
已导入的子样本数量。 processor_task_id String 预处理任务ID。 processor_task_status Integer 预处理任务状态。 status String 导入任务的当前状态。可选值如下: QUEUING:排队中 STARTING:开始执行 RUNNING:运行中
用户项目ID。获取方法请参见获取项目ID和名称。 task_id 是 String 数据处理任务ID。 version_id 是 String 数据处理任务的版本ID。 请求参数 无 响应参数 无 请求示例 删除数据处理任务的版本 DELETE https://{endpoint}/v2/{pro
是否支持图像分割任务的训练? 支持。您可以使用以下三种方式实现图像分割任务的训练。 您可以在AI Gallery订阅相关图像分割任务算法,并使用订阅算法完成训练。 如果您在本地使用ModelArts支持的常用框架完成了训练脚本,可以使用自定义脚本创建训练作业。 如果您在本地开发的
创建训练任务 调试代码 创建训练任务之前,建议先调试代码。 由于Notebook的/cache目录只能支持500G的存储,超过后会导致实例重启,ImageNet数据集大小超过该限制,因此建议用线下资源调试、或用小批量数据集在Notebook调试(Notebook调试方法与使用No