搜索_华为云

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

分布式改造点注释掉后即可进行单节点单卡训练。训练代码中包含三部分入参，分别为训练基础参数、分布式参数和数据相关参数。其中分布式参数由平台自动入参，无需自行定义。数据相关参数中的custom_data表示是否使用自定义数据进行训练，该参数为“true”时使用基于torch自定义的随机数据进行训练和验证。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
推理精度测试 - AI开发平台ModelArts

tasks：评测数据集任务，比如openllm。 batch_size：输入的batch_size大小，不影响精度，只影响得到结果速度，默认使用auto，代表自动选择batch大小。 output_path：结果保存路径。使用lm-eval，比如加载非量化或者awq量化，llama3.2-1b模型的权重，参考命令：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
推理精度测试 - AI开发平台ModelArts

tasks：评测数据集任务，比如openllm。 batch_size：输入的batch_size大小，不影响精度，只影响得到结果速度，默认使用auto，代表自动选择batch大小。 output_path：结果保存路径。使用lm-eval，比如加载非量化或者awq量化，llama3.2-1b模型的权重，参考命令：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
在ModelArts上如何创建引用第三方依赖包的训练作业？ - AI开发平台ModelArts

bleach==1.4.3 click==6.6 依赖包为whl包时如果训练后台不支持下载开源安装包或者使用用户编译的whl包时，由于系统无法自动下载并安装，因此需要在“代码目录”放置此whl包，同时创建一个命名为“pip-requirements.txt”的文件，并且在文件中指定此whl包的包名。依赖包必须为“

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
推理精度测试 - AI开发平台ModelArts

tasks：评测数据集任务，比如openllm。 batch_size：输入的batch_size大小，不影响精度，只影响得到结果速度，默认使用auto，代表自动选择batch大小。 output_path：结果保存路径。使用lm-eval，比如加载非量化或者awq量化，llama3.2-1b模型的权重，参考命令：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
制作自定义镜像用于推理 - AI开发平台ModelArts

模型的自定义镜像制作流程在Notebook中通过镜像保存功能制作自定义镜像用于推理在Notebook中通过Dockerfile从0制作自定义镜像用于推理在ECS中通过Dockerfile从0制作自定义镜像用于推理父主题：制作自定义镜像用于ModelArts Standard

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
MiniCPM-V2.6基于Lite Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

912-xxx.zip软件包中的AscendCloud-AIGC-6.3.912-xxx.zip 说明：包名中的xxx表示具体的时间戳，以包名的实际时间为准。获取路径：Support-E，在此路径中查找下载ModelArts 6.3.912版本。说明：如果上述软件获取路径打

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
配置IAM权限 - AI开发平台ModelArts

"Action": [ "vpc:*:*", "ecs:*:get*", "ecs:*:list*" ], "Effect": "Allow"

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
管理员和开发者权限分离 - AI开发平台ModelArts

"ecs:serverKeypairs:list", "ecs:serverKeypairs:get", "ecs:serverKeypairs:delete", "ecs:serverKeypairs:create"

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
制作自定义镜像用于创建Notebook - AI开发平台ModelArts

制作自定义镜像用于创建Notebook Notebook的自定义镜像制作方法在ECS上构建自定义镜像并在Notebook中使用在Notebook中通过Dockerfile从0制作自定义镜像在Notebook中通过镜像保存功能制作自定义镜像父主题：制作自定义镜像用于ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
推理场景介绍 - AI开发平台ModelArts

软件配套版本和获取地址软件名称说明下载地址 AscendCloud-3rdLLM-6.3.905-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的vLLM 0.3.2推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 6.3.905版本获取路径：Support-E（推荐）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
Llama 3.2-Vision基于Lite Server适配Pytorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

AscendCloud-6.3.912软件包中的AscendCloud-AIGC-6.3.912-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E，在此路径中查找下载ModelArts 6.3.912 版本。说明：如果上述软件获取路

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
训练精度测试 - AI开发平台ModelArts

任务完成之后会在test-benchmark目录下生成excel表格：精度结果 LLaMAFactory_train_accuracy_benchmark_<版本号>_<时间戳>.xlsx 样例截图：父主题：训练benchmark工具

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练benchmark工具
Standard专属资源池 - AI开发平台ModelArts

Standard专属资源池 ModelArts支持使用ECS创建专属资源池吗？在ModelArts中1个节点的专属资源池，能否部署多个服务？在ModelArts中公共资源池和专属资源池的区别是什么？ ModelArts中的作业为什么一直处于等待中？ ModelArts控制台为什么能看到创建失败被删除的专属资源池？

帮助中心 > AI开发平台ModelArts > 常见问题
LLM大语言模型训练推理 - AI开发平台ModelArts

LLM大语言模型训练推理在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）主流开源大模型基于Lite Server适配ModelLink

帮助中心 > AI开发平台ModelArts > 最佳实践
什么是Workflow - AI开发平台ModelArts

数据处理以及多种模型优化，以获得在已有的数据集上更好的模型效果。传统的模型交付会直接在实验迭代结束后以输出的模型为终点。当应用上线后，随着时间的推移，会出现模型漂移的问题。新的数据和新的特征在已有的模型上表现会越来越差。在MLOps中，实验迭代的产物将会是一条固化下来的流水线，这

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
创建Workflow数据集节点 - AI开发平台ModelArts

否 ImportConfig 表5 Importconfig 属性描述是否必填数据类型 import_annotations 是否自动导入输入目录下的标注信息，支持检测/图像分类/文本分类。可选值如下： true：导入输入目录下的标注信息（默认值） false：不导入输入目录下的标注信息

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

d}/worker-{index}/”目录，而“/home/ma-user/modelarts/log/”目录下的“*.log”文件将会被自动上传至ModelArts训练作业的日志目录（OBS）。如果本地相应目录没有生成大小>0的日志文件，则对应的父级目录也不会上传。因此，PyTorch

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
训练作业日志中提示“No module named .*” - AI开发平台ModelArts

bleach==1.4.3 click==6.6 依赖包为whl包时如果训练后台不支持下载开源安装包或者使用用户编译的whl包时，由于系统无法自动下载并安装，因此需要在“代码目录”放置此whl包，同时创建一个命名为“pip-requirements.txt”的文件，并且在文件中指定此whl包的包名。依赖包必须为“

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
训练参数配置说明【旧】 - AI开发平台ModelArts

actory模板Sharegpt数据集 MBS 1 表示流水线并行中一个micro batch所处理的样本量。在流水线并行中，为了减少气泡时间，会将一个step的数据切分成多个micro batch。该值与TP和PP以及模型大小相关，可根据实际情况进行调整。 GBS 128 表

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明参考

总条数： 1399

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

在ModelArts上如何创建引用第三方依赖包的训练作业？ - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

制作自定义镜像用于推理 - AI开发平台ModelArts

MiniCPM-V2.6基于Lite Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

配置IAM权限 - AI开发平台ModelArts

管理员和开发者权限分离 - AI开发平台ModelArts

制作自定义镜像用于创建Notebook - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

Llama 3.2-Vision基于Lite Server适配Pytorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

Standard专属资源池 - AI开发平台ModelArts

LLM大语言模型训练推理 - AI开发平台ModelArts

什么是Workflow - AI开发平台ModelArts

创建Workflow数据集节点 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

训练作业日志中提示“No module named .*” - AI开发平台ModelArts

训练参数配置说明【旧】 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线