搜索_华为云

自动学习/Workflow计费项 - AI开发平台ModelArts

32GB、计算节点个数为1个（单价：3.50 元/小时）。按照计算资源费用、存储费用结算，那么运行这个自动学习作业的费用计算过程如下：创建自动学习项目时，无法直接选择专属资源池。可在项目创建成功后，进入自动学习详情页，然后单击右上角“配置”，在“Workflow配置 > 资源配置”中，选择使用专属资源池。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

-p 8585:8585: 映射端口号 driver及npu-smi需同时挂载至容器。不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。步骤三：进入容器通过容器名称进入容器中。默认使用ma-user用户执行后续命令。 docker exec -it ${container_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

dSpeed; sh ./scripts/install.sh; sh ./scripts/obs_pipeline.sh 如果镜像使用ECS中构建新镜像构建的新镜像时，训练作业启动命令中输入： cd /home/ma-user/modelarts/user-job-dir/AscendSpeed;

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910）
SFT全参微调训练 - AI开发平台ModelArts

dSpeed; sh ./scripts/install.sh; sh ./scripts/obs_pipeline.sh 如果镜像使用ECS中构建新镜像构建的新镜像时，训练作业启动命令中输入： cd /home/ma-user/modelarts/user-job-dir/AscendSpeed;

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Standard上的预训练和全量微调方案。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

limit/request配置cpu和内存大小，已知单节点Snt9B机器为：8张Snt9B卡+192u1536g，请合理规划，避免cpu和内存限制过小引起任务无法正常运行。父主题： Lite Cluster资源使用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
Qwen-VL基于DevServer适配Pytorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

容器时会用到，此处可以自己定义一个容器名称。 ${image_id}：镜像ID，通过docker images查看刚拉取的镜像ID。容器不能挂载到/home/ma-user目录，此目录为ma-user用户家目录。如果容器挂载到/home/ma-user下，拉起容器时会与基础镜像冲突，导致基础镜像不可用。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

dSpeed; sh ./scripts/install.sh; sh ./scripts/obs_pipeline.sh 如果镜像使用ECS中构建新镜像构建的新镜像时，训练作业启动命令中输入： cd /home/ma-user/modelarts/user-job-dir/AscendSpeed;

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
SFT全参微调训练 - AI开发平台ModelArts

dSpeed; sh ./scripts/install.sh; sh ./scripts/obs_pipeline.sh 如果镜像使用ECS中构建新镜像构建的新镜像时，训练作业启动命令中输入： cd /home/ma-user/modelarts/user-job-dir/AscendSpeed;

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
Wav2Lip推理基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

主机中工作目录，目录下存放着代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。容器不能挂载到/home/ma-user目录，此目录为ma-user用户家目录。如果容器挂载到/home/ma-user下，拉起容器时会与基础镜像冲突，导致基础镜像不可用。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
查看Standard专属资源池详情 - AI开发平台ModelArts

该指标用于统计测量对象的磁盘使用率。百分比（Percent） 0～100% GPU/NPU碎片数由于资源调度产生碎片，导致某些卡虽然空闲，但无法被多卡任务所使用。不同卡数的任务，根据已占用卡的分布不同，实际会有不同的碎片情况，且随时间变化，表格中仅表示当前时间的状态。 / / 管理资源池标签

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

th + 'train/') 参数解释： code_dir：必选参数，训练脚本所在的目录。在本地调试的情况下，必须是notebook目录，不能是OBS目录。 boot_file：必选参数，训练启动文件，在code_dir目录下。 obs_path：在多机分布式调测时必选参数，一个

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
模型调试 - AI开发平台ModelArts
模型调试 - AI开发平台ModelArts

生成模型name。 model_version 是 String 模型版本，格式需为“数值.数值.数值”，其中数值为1-2位正整数。版本不可以出现以0开头的版本号形式，如“01.01.01”等。 publish 否 Bool 是否发布模型。可选值： True: 发布模型。（默认值）

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
LLaMA-VID基于DevServer适配PyTorch NPU推理指导（6.3.910) - AI开发平台ModelArts

确的key，这个可能需要进行付费调用，评估1000条大概需要0.15美元 OPENAIKEY="" 注：openai不支持中国大陆和香港，不能使用中国的代理。推理结果保存的文件名，可不用修改，使用默认的文件名 OUTPUTNAME=pred 步骤11 执行推理脚本 bash s

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
LoRA微调训练 - AI开发平台ModelArts

dSpeed; sh ./scripts/install.sh; sh ./scripts/obs_pipeline.sh 如果镜像使用ECS中构建新镜像构建的新镜像时，训练作业启动命令中输入： cd /home/ma-user/modelarts/user-job-dir/AscendSpeed;

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

conversation_id为空的个数) proportion 和 test_count 二选一即可，若同时输入，则优先使用 test_count，若都未输入，则返回处理失败 False。 LLama-Factory Alpaca 指令微调数据：数据集包含有以下字段： instruction：描述模型应执行的任务。指令中的每一条都是唯一的。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
删除资源池 - AI开发平台ModelArts

表10 network 参数参数类型描述 name String 网络名称；用户接口通过指定网络名称创建网络，系统会自动创建子网，用户无法创建子网。默认将创建在第一个子网下。表11 PoolDriver 参数参数类型描述 gpuVersion String GPU驱动版

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
SDXL基于DevServer适配PyTorch NPU的LoRA训练指导（6.3.905） - AI开发平台ModelArts

--device=/dev/davinci0：挂载NPU设备，单卡即可。 driver及npu-smi需同时挂载至容器。不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。进入容器。默认使用ma-user用户，后续所有操作步骤都在ma-user用户下执行。 docker exec -it

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
创建处理任务 - AI开发平台ModelArts

数据来源，与inputs二选一。数据源路径不支持设置为KMS加密桶中的OBS路径。 description 否 String 数据处理任务描述，长度为0-256位，不能包含^!<>=&"'特殊字符。 inputs 否 Array of ProcessorDataSource objects 数据来源列表，

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

conversation_id为空的个数) proportion 和 test_count 二选一即可，若同时输入，则优先使用 test_count，若都未输入，则返回处理失败 False。 LLama-Factory Alpaca 指令微调数据：数据集包含有以下字段： instruction：描述模型应执行的任务。指令中的每一条都是唯一的。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作

总条数： 1200

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

自动学习/Workflow计费项 - AI开发平台ModelArts

Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

Wav2Lip推理基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

查看Standard专属资源池详情 - AI开发平台ModelArts

使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

模型调试 - AI开发平台ModelArts

LLaMA-VID基于DevServer适配PyTorch NPU推理指导（6.3.910) - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

删除资源池 - AI开发平台ModelArts

SDXL基于DevServer适配PyTorch NPU的LoRA训练指导（6.3.905） - AI开发平台ModelArts

创建处理任务 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线