搜索_华为云

训练中的权重转换说明 - AI开发平台ModelArts

HuggingFace转Megatron参数说明 --model-type：模型类型。 --loader：选择对应加载模型脚本的名称。 --saver：选择模型保存脚本的名称。 --tensor-model-parallel-size：${TP}张量并行数，需要与训练脚本中的TP值配置一样。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练中的权重转换说明 - AI开发平台ModelArts

HuggingFace转Megatron参数说明 --model-type：模型类型。 --loader：选择对应加载模型脚本的名称。 --saver：选择模型保存脚本的名称。 --tensor-model-parallel-size：${TP}张量并行数，需要与训练脚本中的TP值配置一样。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明
训练中的权重转换说明 - AI开发平台ModelArts

HuggingFace转Megatron参数说明 --model-type：模型类型。 --loader：选择对应加载模型脚本的名称。 --saver：选择模型保存脚本的名称。 --tensor-model-parallel-size：${TP}张量并行数，需要与训练脚本中的TP值配置一样。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考
查询数据集的版本列表 - AI开发平台ModelArts

描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 status 否 Integer 数据集版本状态。可选值如下： 0：创建中 1：运行中

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
删除资源标签 - AI开发平台ModelArts

ete 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。 resource_id 是 String 资源ID：如Notebook实例ID。请求参数表2 请求Body参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
训练场景和方案介绍 - AI开发平台ModelArts

资源规格要求推荐使用“西南-贵阳一”Region上的Lite Server资源和Ascend Snt9B。软件配套版本表1 获取软件分类名称获取路径插件代码包 AscendCloud-6.3.908软件包中的AscendCloud-AIGC-6.3.908-xxx.zip

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Kohya框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
获取Workflow工作流节点度量信息 - AI开发平台ModelArts

ics 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workflow_id 是 String 工作流的ID。 execution_id 是 String 工作流执行ID。 step_execution_id

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
批量删除样本 - AI开发平台ModelArts

描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 delete_source 否 Boolean 是否删除源文件，对非

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用SDK调测单机训练作业 - AI开发平台ModelArts

将训练任务得到的输出上传到4指定的obs_path中，日志上传到第六步指定的log_url中。同时，可以在任务名后增加时间后缀，区分不同的任务名称。 from datetime import datetime, timedelta import time base_name = "cifar10-dis"

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
推理场景介绍 - AI开发平台ModelArts

本方案支持vLLM的v0.6.0版本。不同vLLM版本支持的模型列表有差异，具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化是否支持W8A8量化是否支持W8A16量化是否支持 kv-cache-int8量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
查询团队标注验收任务报告 - AI开发平台ModelArts

描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workforce_task_id 是 String 团队标注任务ID。表2 Query参数参数是否必选参数类型描述 checking_task_id

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

模型，还需要手动修改tokenizer文件，具体请参见训练tokenizer文件说明。 Step2 创建预训练任务创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及上传的镜像。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。图1 选择镜像训练作业启动命令中输入：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
SFT全参微调训练 - AI开发平台ModelArts

手动修改tokenizer文件，具体请参见训练tokenizer文件说明。 Step2 创建SFT全参微调训练任务创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及上传的镜像。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。图1 选择镜像训练作业启动命令中输入：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
更新工作流定时调度信息 - AI开发平台ModelArts

id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workflow_id 是 String 工作流的ID。 schedule_id 是 String 工作流调度信息ID。请求参数表2

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查询专属资源池作业统计信息 - AI开发平台ModelArts

ads 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 作业所属的资源池。请求参数无响应参数状态码：200 表2 响应Body参数参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
附录：训练常见问题 - AI开发平台ModelArts

问题4：Error waiting on exit barrier错误错误截图：报错原因：多线程退出各个节点间超时时间默认为300s，时间设置过短。解决措施：修改容器内torch/distributed/elastic/agent/server/api.py文件参数： vim

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
训练图像分类模型 - AI开发平台ModelArts

训练完成后，您可以单击“图像分类”节点上方的按钮，查看相关指标信息，如“准确率”、“评估结果”等。评估结果参数说明请参见表1。图1 模型评估报告表1 评估结果参数说明参数名称参数含义说明 recall 召回率被用户标注为某个分类的所有样本中，模型正确预测为该分类的样本比率，反映模型对正样本的识别能力。 precision

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
创建训练作业 - AI开发平台ModelArts

参数是否必选类型描述 obs_path 是 String 数据实际输出到OBS的路径。 name 是 String 输出数据的关键字参数名称，如"output_dir"。表4 fit请求参数说明参数是否必选类型描述 inputs 否 Array of InputData

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
训练启动脚本说明和参数配置 - AI开发平台ModelArts

模型推荐的参数与NPU卡数设置不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量训练策略类型文本序列长度（SEQ_LEN）并行参数设置 micro

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

模型推荐的参数与NPU卡数设置不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量训练策略类型文本序列长度（SEQ_LEN）并行参数设置 micro

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明

总条数： 1729

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

查询数据集的版本列表 - AI开发平台ModelArts

删除资源标签 - AI开发平台ModelArts

训练场景和方案介绍 - AI开发平台ModelArts

获取Workflow工作流节点度量信息 - AI开发平台ModelArts

批量删除样本 - AI开发平台ModelArts

使用SDK调测单机训练作业 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

查询团队标注验收任务报告 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

更新工作流定时调度信息 - AI开发平台ModelArts

查询专属资源池作业统计信息 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

训练图像分类模型 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线