搜索_华为云

执行LoRA微调训练任务 - AI开发平台ModelArts

NODE_RANK=0 NPUS_PER_NODE=4 sh scripts/llama2/0_pl_lora_7b.sh 最后，请参考查看日志和性能章节查看LoRA微调的日志和性能。父主题：主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911）
创建Workflow数据集导入节点 - AI开发平台ModelArts

4字符)。同一个Step的输入名称不能重复。是 str data 数据集导入节点的输入数据对象。是数据集、OBS或标注任务相关对象，当前仅支持Dataset，DatasetConsumption，DatasetPlaceholder，OBSPath，OBSConsumpti

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
执行预训练任务 - AI开发平台ModelArts

执行训练启动命令后，等待模型载入，当出现“training”关键字时，表示开始训练。训练过程中，训练日志会在最后的Rank节点打印。图1 等待模型载入最后，请参考查看日志和性能章节查看预训练的日志和性能。父主题：主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910）
执行预训练任务 - AI开发平台ModelArts

执行训练启动命令后，等待模型载入，当出现“training”关键字时，表示开始训练。训练过程中，训练日志会在最后的Rank节点打印。图1 等待模型载入最后，请参考查看日志和性能章节查看预训练的日志和性能。父主题：主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911）
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

PyTorch模型获取模型shape，主要有如下两种方式获取：方式一：通过stable diffusion的PyTorch模型获取模型shape。方式二：通过查看ModelArts-Ascend代码仓库，根据每个模型的configs文件获取已知的shape大小。下文主要介绍如何通过方式一获取模型shape。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
扩缩容Standard专属资源池 - AI开发平台ModelArts

修改容器引擎空间大小登录ModelArts管理控制台，在左侧菜单栏中选择“AI专属资源池 > 弹性集群Cluster”，进入“Standard资源池”页签，查看资源池列表。在旧版资源池迁移到新版资源池的过程中，资源池状态显示为“受限”。此时，资源池无法进行扩缩容和退订。单击某个资源池操作列右侧

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
增加AppCode - AI开发平台ModelArts
增加AppCode - AI开发平台ModelArts

app名称。 app_remark 否 String app备注。 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。响应参数状态码：200 表4 响应Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
创建数据集标签 - AI开发平台ModelArts

是否必选参数类型描述 default_value 否 String 标签属性默认值。 id 否 String 标签属性ID。可通过调用标签列表查询。 name 否 String 标签属性名称。不能超过64个字符，不能包含字符!<>=&"'。 type 否 String 标签属性类型。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
如何在ModelArts的Notebook中上传下载OBS文件？ - AI开发平台ModelArts

denied。请依次排查：请确保读取的OBS桶和Notebook处于同一站点区域，例如：都在华北-北京四站点。不支持跨站点访问OBS桶。具体请参见查看OBS桶与ModelArts是否在同一个区域。请确认操作Notebook的账号有权限读取OBS桶中的数据。如没有权限，请参见在Model

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
训练的权重转换说明 - AI开发平台ModelArts

ne-parallel-size，默认为1。注意：权重转换完成后，需要将转换后的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等to

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明
执行预训练任务 - AI开发平台ModelArts

执行训练启动命令后，等待模型载入，当出现“training”关键字时，表示开始训练。训练过程中，训练日志会在最后的Rank节点打印。图1 等待模型载入最后，请参考查看日志和性能章节查看预训练的日志和性能。父主题：主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908）
执行预训练任务 - AI开发平台ModelArts

执行训练启动命令后，等待模型载入，当出现“training”关键字时，表示开始训练。训练过程中，训练日志会在最后的Rank节点打印。图1 等待模型载入最后，请参考查看日志和性能章节查看预训练的日志和性能。父主题：主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909）
重置AppCode - AI开发平台ModelArts
重置AppCode - AI开发平台ModelArts

app名称。 app_remark 否 String app备注。 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。响应参数状态码：200 表4 响应Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
构建条件节点控制分支执行 - AI开发平台ModelArts

on、MetricInfo 表3 MetricInfo 属性描述是否必填数据类型 input_data metric文件的存储对象，当前仅支持JobStep节点的输出是 JobStep的输出 json_key 需要获取的metric信息对应的key值是 str 结构内容详解：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
获取训练作业事件列表 - AI开发平台ModelArts

String 用户项目ID。获取方法请参见获取项目ID和名称。 training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。表2 Query参数参数是否必选参数类型描述 offset 否 Integer 数据条目偏移量。 limit 否 Integer

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
Eagle投机小模型训练 - AI开发平台ModelArts

max_length：模型的max_length。 dtype：为模型dtype，默认为bfloat16。执行完成后，记得unset环境变量，否则会导致后续推理服务启动出错。 unset EAGLE_TARIN_MODE 执行完成后，如果used_npus>1，则需要将训练生成data数据重新分配为8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
Eagle投机小模型训练 - AI开发平台ModelArts

max_length：模型的max_length。 dtype：为模型dtype，默认为bfloat16。执行完成后，记得unset环境变量，否则会导致后续推理服务启动出错。 unset EAGLE_TARIN_MODE 执行完成后，如果used_npus>1，则需要将训练生成data数据重新分配为8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
Eagle投机小模型训练 - AI开发平台ModelArts

max_length：模型的max_length。 dtype：为模型dtype，默认为bfloat16。执行完成后，记得unset环境变量，否则会导致后续推理服务启动出错。 unset EAGLE_TARIN_MODE 执行完成后，如果used_npus>1，则需要将训练生成data数据重新分配为8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
训练启动脚本说明和参数配置【旧】 - AI开发平台ModelArts

$(readlink -f "$0")) 表示执行脚本时的路径。 MODEL_NAME llama2-13b 对应模型名称。 STAGE pt 表示当前的训练阶段。可选择值：【pt、sft】 sft：代表监督微调； pt：代表预训练； FINETUNING_TYPE full 表示训练策略。可选择值【full、lora】：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
终止训练作业 - AI开发平台ModelArts

会话对象，初始化方法请参考Session鉴权。 job_id 是 String 训练作业的id，可通过创建训练作业生成的训练作业对象查询，如"job_instance.job_id"，或从查询训练作业列表的响应中获得。表2 返回参数说明参数参数类型描述 kind String 训练作业类型。默认使用job。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业

总条数： 1983

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

执行LoRA微调训练任务 - AI开发平台ModelArts

创建Workflow数据集导入节点 - AI开发平台ModelArts

执行预训练任务 - AI开发平台ModelArts

执行预训练任务 - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

扩缩容Standard专属资源池 - AI开发平台ModelArts

增加AppCode - AI开发平台ModelArts

创建数据集标签 - AI开发平台ModelArts

如何在ModelArts的Notebook中上传下载OBS文件？ - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

执行预训练任务 - AI开发平台ModelArts

执行预训练任务 - AI开发平台ModelArts

重置AppCode - AI开发平台ModelArts

构建条件节点控制分支执行 - AI开发平台ModelArts

获取训练作业事件列表 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

训练启动脚本说明和参数配置【旧】 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线