搜索_华为云

执行训练任务 - AI开发平台ModelArts

wen模板进行训练，模板选择可参照表1中的template列 output_dir /home/ma-user/ws/Qwen2-72B/sft-4096 必须修改。指定输出目录。训练过程中生成的模型参数和日志文件将保存在这个目录下。用户根据自己实际要求适配。 per_device_train_batch_size

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）
执行训练任务 - AI开发平台ModelArts

wen模板进行训练，模板选择可参照表1中的template列 output_dir /home/ma-user/ws/Qwen2-72B/sft-4096 必须修改。指定输出目录。训练过程中生成的模型参数和日志文件将保存在这个目录下。用户根据自己实际要求适配。 per_device_train_batch_size

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
执行训练任务 - AI开发平台ModelArts

wen模板进行训练，模板选择可参照表1中的template列 output_dir /home/ma-user/ws/Qwen2-72B/sft-4096 必须修改。指定输出目录。训练过程中生成的模型参数和日志文件将保存在这个目录下。用户根据自己实际要求适配。 per_device_train_batch_size

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910）
guided-decoding - AI开发平台ModelArts

Schema通过定义对象属性、类型、格式的方式来引导模型生成一个包含用户信息的JSON对象。其优势主要如下：上下文引导：通过提供特定的提示或上下文信息，模型可以更好地理解生成内容的方向。约束生成：可以设定某些限制条件，如关键词、主题或风格，使生成的内容更加一致和相关。提高质量：通过引导，生成的文本通常更具逻辑性和连贯性，减少无关信息的出现。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
删除训练作业参数 - AI开发平台ModelArts

error_message String 调用失败时的错误信息。调用成功时无此字段。 error_code String 调用失败时的错误码，具体请参见错误码。调用成功时无此字段。请求示例如下以删除名称为“test-trainconfig”的作业参数为例。 DELETE htt

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

准备权重本方案部署使用的是BF16权重。获取权重有2种方式：方式一：直接获取已经转换完成的BF16权重。方式二：将基于DeepSeek官网提供的FP8权重转换为BF16权重。约束限制由于模型权重较大，请确保您的磁盘有足够的空间放下所有权重，例如DeepSeek-V3在转

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
更新训练作业参数 - AI开发平台ModelArts

String 自定义镜像训练作业的自定义镜像的SWR-URL。如：“100.125.5.235:20202/jobmng/custom-cpu-base:1.0”。 user_command 否 String 自定义镜像训练作业的自定义镜像的容器的启动命令。形式为：“bash /home/work/run_train

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
msprobe精度比对 - AI开发平台ModelArts

精度比对功能主要针对两类场景的问题：同一模型，从CPU或GPU移植到NPU中存在精度下降问题，对比NPU芯片中的API计算数值与CPU或GPU芯片中的API计算数值，进行问题定位。同一模型，进行迭代（模型、框架版本升级或设备硬件升级）时存在的精度下降问题，对比相同模型在迭代前后版本的API计算数值，进行问题定位。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
使用AWQ量化 - AI开发平台ModelArts

低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：per-group Step1 模型量化可以在Huggingface开源社区获取AWQ量化后的模型权重；或者获取FP16/BF16的模型权重之后，通过autoAWQ工具进行量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
查询预置算法 - AI开发平台ModelArts

Integer 指定每一页展示作业参数的总量，默认为10，“per_page”可选的范围为[1，100]。 page 否 Integer 指定要查询页的索引，默认为1。 sortBy 否 String 指定查询的排序方式，默认是根据引擎查找“engine”，目前支持的排序还有模型名称“mode

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
查询可视化作业详情 - AI开发平台ModelArts

resource_id String 可视化作业的计费资源ID。 job_id Long 可视化作业的ID。 job_desc String 可视化作业的具体描述。 duration Long 可视化作业的运行时长，单位为毫秒。 create_time Long 可视化作业的创建时间，时间戳格式。 train_url

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
更新可视化作业描述 - AI开发平台ModelArts

job_desc 是 String 对可视化作业的描述，字符串的长度限制为[0，256]。响应消息响应参数如表3所示。表3 响应参数参数参数类型说明 is_success Boolean 请求是否成功。 error_code String 调用失败时的错误码，具体请参见错误码。调用成功时无此字段。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
查询作业引擎规格 - AI开发平台ModelArts

MindSpore-GPU engine_id Long 训练作业的引擎ID。 engine_name String 训练作业的引擎名称。 engine_version String 训练作业使用的引擎版本。请求示例如下以查看训练作业的资源引擎规格为例。 GET https://en

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 资源和引擎规格接口
使用AWQ量化 - AI开发平台ModelArts

低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：per-group Step1 模型量化可以在Huggingface开源社区获取AWQ量化后的模型权重；或者获取FP16/BF16的模型权重之后，通过autoAWQ工具进行量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
附录：config.json文件 - AI开发平台ModelArts

size。config.json文件中默认是50，并发请求数量超出设置，推理请求会被拒绝。用户可以根据实际修改。 maxSeqLen：输入长度+输出长度的最大值。config.json文件中默认是6k，用户可以根据自己的推理场景设置。 httpsEnabled：取值需要修改为false。 mul

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
计费样例 - AI开发平台ModelArts
计费样例 - AI开发平台ModelArts

采用哪种计费模式才是最具性价比的方式。计费构成分析基于此案例，可详细计算出按需计费和包年/包月两种不同的计费模式的消费情况。此案例中的单价仅为示例，且计算出的费用为估算值。单价的变动和实际场景中计算出来的费用可能会有偏差。请以华为云官网发布的数据为准。在使用ModelAr

帮助中心 > AI开发平台ModelArts > 计费说明
断点续训和故障快恢说明 - AI开发平台ModelArts

件：如果用户指定${user_converted_ckpt_path} 因故障快恢读取权重的优先级最高则训练过程的权重保存路径${output_dir}/saved_checkpoints（加载故障快恢路径）必须为空，否则此参数无效断点续训失效。如果就是使用最新的训练权重进

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

驱动程序可能已经正确配置，从而解决了这个问题。硬件问题：如果GPU之间的NVLINK连接存在硬件故障，那么这可能会导致带宽受限。重新安装软件后，重启系统，可能触发了某种硬件自检或修复机制，从而恢复了正常的带宽。系统负载问题：最初测试GPU卡间带宽时，可能存在其他系统负载，如进

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
断点续训和故障快恢说明 - AI开发平台ModelArts

件：如果用户指定${user_converted_ckpt_path} 因故障快恢读取权重的优先级最高则训练过程的权重保存路径${output_dir}/saved_checkpoints（加载故障快恢路径）必须为空，否则此参数无效断点续训失效。如果就是使用最新的训练权重进

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
断点续训和故障快恢说明 - AI开发平台ModelArts

件：如果用户指定${user_converted_ckpt_path} 因故障快恢读取权重的优先级最高则训练过程的权重保存路径${output_dir}/saved_checkpoints（加载故障快恢路径）必须为空，否则此参数无效断点续训失效。如果就是使用最新的训练权重进

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明参考

总条数： 2176

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

执行训练任务 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

guided-decoding - AI开发平台ModelArts

删除训练作业参数 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

更新训练作业参数 - AI开发平台ModelArts

msprobe精度比对 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

查询预置算法 - AI开发平台ModelArts

查询可视化作业详情 - AI开发平台ModelArts

更新可视化作业描述 - AI开发平台ModelArts

查询作业引擎规格 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

附录：config.json文件 - AI开发平台ModelArts

计费样例 - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线