搜索_华为云

管理标注数据 - AI开发平台ModelArts

修改标签：单击操作列的编辑图标，然后在弹出的对话框中输入修改后的标签名，然后单击“确定”完成修改。修改后，之前添加了此标签的音频，都将被标注为新的标签名称。删除标签：单击操作列的删除图标，在弹出的对话框中，根据提示框选择需要删除的对象，然后单击“确定”完成删除。修改标注信息当数据完成标注后，您还可以进入已标注页签，对已标注的数据进行修改。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
训练参数配置说明【旧】 - AI开发平台ModelArts

TOTAL_LIMIT的值一致。 MA_TRAIN_AUTO_RESUME False 【可选】【故障快恢】是否开启此功能，【True、False】默认False不开启，当训练中断时重启任务会从最新生成权重文件处继续训练。详见断点续训和故障快恢说明 CKPT_LOAD_TYPE 1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明参考
训练参数配置说明【旧】 - AI开发平台ModelArts

TOTAL_LIMIT的值一致。 MA_TRAIN_AUTO_RESUME False 【可选】【故障快恢】是否开启此功能，【True、False】默认False不开启，当训练中断时重启任务会从最新生成权重文件处继续训练。详见断点续训和故障快恢说明 CKPT_LOAD_TYPE 1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明参考
查询团队标注任务详情 - AI开发平台ModelArts

synchronize_auto_labeling_data Boolean 团队标注任务是否同步智能标注结果。可选值如下： true：执行完智能标注后，将待确认结果同步至团队成员。 false：不同步智能标注结果（默认值）。 synchronize_data Boolean 团队标注任务是否同步更新新增数据。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
推理性能测试 - AI开发平台ModelArts

需和服务启动时配置的num-scheduler-steps一致。默认为1。 --enable-prefix-caching：服务端是否启用enable-prefix-caching特性，默认为false。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。图1 静态benchmark测试结果（示意图）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
分页查询团队标注任务下的样本列表 - AI开发平台ModelArts

CTED__：采样已驳回 __AUTO_ANNOTATION__：待确认 search_conditions 否 String URL编码后的多维筛选条件（多个SearchCondition之间为and的关系）。请求参数无响应参数状态码： 200 表3 响应Body参数参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询样本列表 - AI开发平台ModelArts

0：图像 1：文本 2：音频 4：表格 6：视频 9：自由格式（默认值） search_conditions 否 String URL编码后的多维筛选条件（多个SearchCondition之间为and的关系）。 version_id 否 String 数据集版本ID。请求参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
批量添加样本 - AI开发平台ModelArts

是否必选参数类型描述 data 否 Object 样本文件的字节数据。类型为java.nio.ByteBuffer，前台调用时传字节数据转换后的字符串。 data_source 否 DataSource object 数据来源。 encoding 否 String 样本文件的编码类

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Yaml配置文件参数配置说明 - AI开发平台ModelArts

指定模型训练过程中，每多少步保存一次模型。保存的模型可以用于后续的训练或推理任务。当参数值>=max_steps时，生成模型仅保存经过TRAIN_ITERS次训练后的最后一个版本。当参数值<max_steps时，生成模型会每经过save_steps次，保存一次模型版本。模型版本保存次数=max_steps//save_steps

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
Yaml配置文件参数配置说明 - AI开发平台ModelArts

指定模型训练过程中，每多少步保存一次模型。保存的模型可以用于后续的训练或推理任务 plot_loss true 用于指定是否绘制损失曲线。如果设置为"true"，则在训练结束后，将损失曲线保存为图片 overwrite_output_dir true 是否覆盖输出目录。如果设置为"true"，则在每次训练开始时，都会清空输出目录，以便保存新的训练结果。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
更新资源池 - AI开发平台ModelArts

订单id，包周期创建和变更的时候需要传递该参数。表6 PoolSpecUpdate 参数是否必选参数类型描述 scope 否 Array of strings 更新启用的作业类型。可选值如下： Train：训练作业 Infer：推理作业 Notebook：Notebook作业 resources 否 Array

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
语言模型推理性能测试 - AI开发平台ModelArts

有配置，则默认为tokenizer。 --enable-prefix-caching：服务端是否启用enable-prefix-caching特性，默认为false。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。图1 静态benchmark测试结果（示意图）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
Yaml配置文件参数配置说明 - AI开发平台ModelArts

指定模型训练过程中，每多少步保存一次模型。保存的模型可以用于后续的训练或推理任务 plot_loss true 用于指定是否绘制损失曲线。如果设置为"true"，则在训练结束后，将损失曲线保存为图片 overwrite_output_dir true 是否覆盖输出目录。如果设置为"true"，则在每次训练开始时，都会清空输出目录，以便保存新的训练结果。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

l”。描述输入参数的说明，用户可以自定义描述。获取方式输入参数的获取方式，默认使用“超参”，也可以选择“环境变量”。输入约束开启后，用户可以根据实际情况限制数据输入来源。输入来源可以选择“数据存储位置”或者“ModelArts数据集”。如果用户选择数据来源为ModelArts数据集，还可以约束以下三种：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

的内核和其他相关信息。安装过程中的提示均选OK或YES，安装好后执行reboot重启机器，再次登录后执行命令查看GPU卡信息。 nvidia-smi -pm 1 #该命令执行时间较长，请耐心等待，作用为启用持久模式，可以优化Linux实例上GPU设备的性能 nvidia-smi

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
使用CES监控Lite Server资源 - AI开发平台ModelArts

当前故障很可能需要重启进行恢复在收集必要信息后，重启以尝试恢复重启可能中断客户业务 Snt3P 300IDuo Snt9B Snt9C NPU: 需要复位SOC ResetSOC 提示当前故障很可能需要复位SOC进行恢复在收集必要信息后，复位SOC以尝试恢复复位SOC可能中断客户业务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
终止训练作业 - AI开发平台ModelArts

本地运行的启动方式： init_or_rescheduled：代表本次启动为被调度后的首次运行，包括初次启动及调度恢复后的运行。 restarted：代表本次启动非被调度后的首次运行，为进程重启后的运行。 end_reason String 本次运行结束原因。 end_related_task

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

指定custom_data = 'true'后可直接进行训练作业，无需加载数据。训练代码以下代码中以“### 分布式改造，... ###”注释的代码即为多节点分布式训练需要适配的代码改造点。不对示例代码进行任何修改，适配数据路径后即可在ModelArts上完成多节点分布式训练。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练

总条数： 1038

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理标注数据 - AI开发平台ModelArts

训练参数配置说明【旧】 - AI开发平台ModelArts

训练参数配置说明【旧】 - AI开发平台ModelArts

查询团队标注任务详情 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

分页查询团队标注任务下的样本列表 - AI开发平台ModelArts

查询样本列表 - AI开发平台ModelArts

批量添加样本 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

更新资源池 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线