搜索_华为云

训练精度测试 - AI开发平台ModelArts

fgs.yaml相对或绝对路径 --dataset <dataset>：评估数据集；可选值：all、mmlu、ceval，默认值为all，用户只需选择参数即可，数据集路径eval接口已指定好。 --model_name <model_name>：训练模型名 --run_type

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练benchmark工具
训练精度测试 - AI开发平台ModelArts

fgs.yaml相对或绝对路径 --dataset <dataset>：评估数据集；可选值：all、mmlu、ceval，默认值为all，用户只需选择参数即可，数据集路径eval接口已指定好。 --model_name <model_name>：训练模型名 --run_type

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.5.901） > 训练benchmark工具
更新数据集 - AI开发平台ModelArts

表1 路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 add_labels 否 Array

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询训练作业列表 - AI开发平台ModelArts

Template RL，其余默认为Template DL。表6 Status 参数参数类型描述 phase String 训练作业一级状态，状态值稳定不变，可选值如下： “Creating”、“Pending”、“Running”、“Failed”、“Completed”、

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

指定算法所属的ai项目，默认值为"default-ai-project"。ai项目已下线，无需关注。 user_name String 用户名称。 domain_id String 用户的domainID。 source String 算法来源类型。 api_version String 算法api版本，标识新旧版。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
精度调优前准备工作 - AI开发平台ModelArts

训练超参数。常见的超参如下图所示：图1 训练超参数模型的超参通常可能调整的主要有学习率、batch size、并行切分策略、学习率warm-up、模型参数、FA配置等。用户在进行NPU精度和GPU精度比对前，需要保证两边的配置一致。表1 超参说明超参说明学习率影响模型收敛程度，决定了模型在每次更新权

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
查询事件列表 - AI开发平台ModelArts

GET /v1/{project_id}/events 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 resource 是 String 事

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询资源规格列表 - AI开发平台ModelArts

/v1/{project_id}/resourceflavors 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 continue 否 String 分页查询时上一页位置。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
断点续训练 - AI开发平台ModelArts

ckpoint接续训练。当需要从训练中断的位置接续训练，只需要加载checkpoint，并用checkpoint信息初始化训练状态即可。用户需要在代码里加上reload ckpt的代码，使能读取前一次训练保存的预训练模型。原有训练参数配置表1断点续训练中新加MODEL_PAT

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
断点续训练 - AI开发平台ModelArts

ckpoint接续训练。当需要从训练中断的位置接续训练，只需要加载checkpoint，并用checkpoint信息初始化训练状态即可。用户需要在代码里加上reload ckpt的代码，使能读取前一次训练保存的预训练模型。断点续训练操作过程 GLM3-6B的断点续训脚本glm3_base

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
执行训练任务 - AI开发平台ModelArts

/home/ma-user/ws/Qwen2-72B/sft-4096 必须修改。指定输出目录。训练过程中生成的模型参数和日志文件将保存在这个目录下。用户根据自己实际要求适配。 per_device_train_batch_size 1 指定每个设备的训练批次大小 gradient_accumulation_steps

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
执行训练任务 - AI开发平台ModelArts

/home/ma-user/ws/Qwen2-72B/sft-4096 必须修改。指定输出目录。训练过程中生成的模型参数和日志文件将保存在这个目录下。用户根据自己实际要求适配。 per_device_train_batch_size 1 指定每个设备的训练批次大小 gradient_accumulation_steps

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910）
查询节点列表 - AI开发平台ModelArts

/v2/{project_id}/pools/{pool_name}/nodes 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池名称。表2 Query参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
demo.sh方式启动（历史版本） - AI开发平台ModelArts

/home/ma-user/ws/Qwen2-72B/sft-4096 必须修改。指定输出目录。训练过程中生成的模型参数和日志文件将保存在这个目录下。用户根据自己实际要求适配。 per_device_train_batch_size 1 指定每个设备的训练批次大小 gradient_accumulation_steps

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.5.901） > 执行训练任务
团队成员查询团队标注任务列表 - AI开发平台ModelArts

/v2/{project_id}/workforces/worker-tasks 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询节点池的节点列表 - AI开发平台ModelArts

ls/{nodepool_name}/nodes 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池名称。 nodepool_name 是 String

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
查询团队标注任务统计信息 - AI开发平台ModelArts

表1 路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workforce_task_id 是 String 团队标注任务ID。表2 Query参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
预训练数据处理 - AI开发平台ModelArts

aca_text_document.bin和alpaca_text_document.idx文件。图1 处理后的数据自定义数据如果是用户自己准备的数据集，可以使用Ascendspeed代码仓中的转换工具将json格式数据集转换为训练中使用的.idx + .bin格式。 #示例

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于Lite Server适配PyTorch NPU训练指导（6.3.904） > 预训练
预训练数据处理 - AI开发平台ModelArts

aca_text_document.bin和alpaca_text_document.idx文件。图1 处理后的数据自定义数据如果是用户自己准备的数据集，可以使用Ascendspeed代码仓中的转换工具将json格式数据集转换为训练中使用的.idx + .bin格式。 #示例：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于Lite Server适配PyTorch NPU训练指导（6.3.904） > 预训练
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

快捷键“win+R”，在“运行”窗口中输入“sysdm.cpl”，单击“确定”。在“系统属性”中切换到“高级”页签，单击“环境变量”。在“环境变量”的“用户变量”中鼠标左键双击“Path”，在“编辑环境变量”窗口单击“新增”，新增Python和pip的安装路径。安装路径需定位到Scripts文

 帮助中心 > AI开发平台ModelArts > SDK参考

总条数： 1426

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练精度测试 - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

更新数据集 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

精度调优前准备工作 - AI开发平台ModelArts

查询事件列表 - AI开发平台ModelArts

查询资源规格列表 - AI开发平台ModelArts

断点续训练 - AI开发平台ModelArts

断点续训练 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

查询节点列表 - AI开发平台ModelArts

demo.sh方式启动（历史版本） - AI开发平台ModelArts

团队成员查询团队标注任务列表 - AI开发平台ModelArts

查询节点池的节点列表 - AI开发平台ModelArts

查询团队标注任务统计信息 - AI开发平台ModelArts

预训练数据处理 - AI开发平台ModelArts

预训练数据处理 - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线