检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
修改标签:单击操作列的编辑图标,然后在弹出的对话框中输入修改后的标签名,然后单击“确定”完成修改。修改后,之前添加了此标签的音频,都将被标注为新的标签名称。 删除标签:单击操作列的删除图标,在弹出的对话框中,根据提示框选择需要删除的对象,然后单击“确定”完成删除。 修改标注信息 当数据完成标注后,您还可以进入已标注页签,对已标注的数据进行修改。
TOTAL_LIMIT的值一致。 MA_TRAIN_AUTO_RESUME False 【可选】【故障快恢】是否开启此功能,【True、False】默认False不开启,当训练中断时重启任务会从最新生成权重文件处继续训练。详见断点续训和故障快恢说明 CKPT_LOAD_TYPE 1
TOTAL_LIMIT的值一致。 MA_TRAIN_AUTO_RESUME False 【可选】【故障快恢】是否开启此功能,【True、False】默认False不开启,当训练中断时重启任务会从最新生成权重文件处继续训练。详见断点续训和故障快恢说明 CKPT_LOAD_TYPE 1
synchronize_auto_labeling_data Boolean 团队标注任务是否同步智能标注结果。可选值如下: true:执行完智能标注后,将待确认结果同步至团队成员。 false:不同步智能标注结果(默认值)。 synchronize_data Boolean 团队标注任务是否同步更新新增数据。可选值如下:
需和服务启动时配置的num-scheduler-steps一致。默认为1。 --enable-prefix-caching:服务端是否启用enable-prefix-caching特性,默认为false。 脚本运行完成后,测试结果保存在benchmark_parallel.csv中,示例如下图所示。 图1 静态benchmark测试结果(示意图)
CTED__:采样已驳回 __AUTO_ANNOTATION__:待确认 search_conditions 否 String URL编码后的多维筛选条件(多个SearchCondition之间为and的关系)。 请求参数 无 响应参数 状态码: 200 表3 响应Body参数 参数
0:图像 1:文本 2:音频 4:表格 6:视频 9:自由格式(默认值) search_conditions 否 String URL编码后的多维筛选条件(多个SearchCondition之间为and的关系)。 version_id 否 String 数据集版本ID。 请求参数
是否必选 参数类型 描述 data 否 Object 样本文件的字节数据。类型为java.nio.ByteBuffer,前台调用时传字节数据转换后的字符串。 data_source 否 DataSource object 数据来源。 encoding 否 String 样本文件的编码类
指定模型训练过程中,每多少步保存一次模型。保存的模型可以用于后续的训练或推理任务。 当参数值>=max_steps时,生成模型仅保存经过TRAIN_ITERS次训练后的最后一个版本。 当参数值<max_steps时,生成模型会每经过save_steps次,保存一次模型版本。 模型版本保存次数=max_steps//save_steps
指定模型训练过程中,每多少步保存一次模型。保存的模型可以用于后续的训练或推理任务 plot_loss true 用于指定是否绘制损失曲线。如果设置为"true",则在训练结束后,将损失曲线保存为图片 overwrite_output_dir true 是否覆盖输出目录。如果设置为"true",则在每次训练开始时,都会清空输出目录,以便保存新的训练结果。
订单id,包周期创建和变更的时候需要传递该参数。 表6 PoolSpecUpdate 参数 是否必选 参数类型 描述 scope 否 Array of strings 更新启用的作业类型。可选值如下: Train:训练作业 Infer:推理作业 Notebook:Notebook作业 resources 否 Array
有配置,则默认为tokenizer。 --enable-prefix-caching:服务端是否启用enable-prefix-caching特性,默认为false。 脚本运行完成后,测试结果保存在benchmark_parallel.csv中,示例如下图所示。 图1 静态benchmark测试结果(示意图)
指定模型训练过程中,每多少步保存一次模型。保存的模型可以用于后续的训练或推理任务 plot_loss true 用于指定是否绘制损失曲线。如果设置为"true",则在训练结束后,将损失曲线保存为图片 overwrite_output_dir true 是否覆盖输出目录。如果设置为"true",则在每次训练开始时,都会清空输出目录,以便保存新的训练结果。
l”。 描述 输入参数的说明,用户可以自定义描述。 获取方式 输入参数的获取方式,默认使用“超参”,也可以选择“环境变量”。 输入约束 开启后,用户可以根据实际情况限制数据输入来源。输入来源可以选择“数据存储位置”或者“ModelArts数据集”。 如果用户选择数据来源为ModelArts数据集,还可以约束以下三种:
的内核和其他相关信息。 安装过程中的提示均选OK或YES,安装好后执行reboot重启机器,再次登录后执行命令查看GPU卡信息。 nvidia-smi -pm 1 #该命令执行时间较长,请耐心等待,作用为启用持久模式,可以优化Linux实例上GPU设备的性能 nvidia-smi
当前故障很可能需要重启进行恢复 在收集必要信息后,重启以尝试恢复 重启可能中断客户业务 Snt3P 300IDuo Snt9B Snt9C NPU: 需要复位SOC ResetSOC 提示 当前故障很可能需要复位SOC进行恢复 在收集必要信息后,复位SOC以尝试恢复 复位SOC可能中断客户业务
本地运行的启动方式: init_or_rescheduled:代表本次启动为被调度后的首次运行,包括初次启动及调度恢复后的运行。 restarted:代表本次启动非被调度后的首次运行,为进程重启后的运行。 end_reason String 本次运行结束原因。 end_related_task
指定custom_data = 'true'后可直接进行训练作业,无需加载数据。 训练代码 以下代码中以“### 分布式改造,... ###”注释的代码即为多节点分布式训练需要适配的代码改造点。 不对示例代码进行任何修改,适配数据路径后即可在ModelArts上完成多节点分布式训练。