搜索_华为云

训练启动脚本说明和参数配置 - AI开发平台ModelArts

copy_parallel(local_data_dir, obs_data_dir) 模型推荐的参数与NPU卡数设置不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 不同模型推荐的参数与NPU卡数设置序号

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.911） > 训练脚本说明
在推理生产环境中部署推理服务 - AI开发平台ModelArts

convert_eagle_ckpt_to_vllm_compatible.py --base-path 大模型权重地址 --draft-path 小模型权重地址 --base-weight-name 大模型包含lm_head的权重文件名 --draft-weight-name 小模型权重文件名

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
CogVideoX模型基于DevServer适配PyTorch NPU全量训练指导（6.3.911） - AI开发平台ModelArts

性能优于所有公开可用的模型，在机器和人类评估方面都有很大的优势。方案概览本方案介绍了在ModelArts的DevServer上使用昇腾计算资源开展CogVideoX-2b/5b全量微调的详细过程。完成本方案的部署，需要先联系您所在企业的华为方技术支持购买DevServer资源。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
训练启动脚本说明和参数配置 - AI开发平台ModelArts

copy_parallel(local_data_dir, obs_data_dir) 模型推荐的参数与NPU卡数设置不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 不同模型推荐的参数与NPU卡数设置序号

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910） > 训练脚本说明
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

EPS FullAccess 云审计服务CTS CTS Administrator 云日志服务LTS LTS FullAccess 虚拟私有云VPC VPC FullAccess 容器镜像服务SWR SWR Admin AI开发平台ModelArts ModelArts CommonOperations

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
部署推理服务 - AI开发平台ModelArts

DEFER_MS=10 # 延迟解码时间，默认值为10，单位为ms。将Token解码延迟进行的毫秒数，使得当次Token解码能与下一次模型推理并行计算，从而减少总推理时延。该参数需要设置环境变量DEFER_DECODE=1才能生效。 export USE_VOCAB_PARALLEL=1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
错误码 - AI开发平台ModelArts
错误码 - AI开发平台ModelArts

pc bin file error 解析点云二进制文件时错误请检查点云二进制文件是否被破坏。 400 ModelArts.4369 Parse pc prelabel json file error 解析点云预标注文件错误请检查点云标注文件是否正确。 400 ModelArts

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
训练启动脚本说明和参数配置 - AI开发平台ModelArts

设置：需要遵循GBS/MBS的值能够被NPU/(TP×PP×CP)的值进行整除。模型推荐的参数与NPU卡数设置不同模型推荐的训练参数和计算规格要求如表2所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表2 不同模型推荐的参数与NPU卡数设置序号

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

设置：需要遵循GBS/MBS的值能够被NPU/(TP×PP×CP)的值进行整除。模型推荐的参数与NPU卡数设置不同模型推荐的训练参数和计算规格要求如表2所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表2 不同模型推荐的参数与NPU卡数设置序号

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
训练启动脚本说明和参数配置 - AI开发平台ModelArts

设置：需要遵循GBS/MBS的值能够被NPU/(TP×PP×CP)的值进行整除。模型推荐的参数与NPU卡数设置不同模型推荐的训练参数和计算规格要求如表2所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表2 不同模型推荐的参数与NPU卡数设置序号

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.910） > 训练脚本说明
查看Standard专属资源池详情 - AI开发平台ModelArts

用卡的分布不同，实际会有不同的碎片情况，且随时间变化，表格中仅表示当前时间的状态。 / / 管理资源池标签通过给资源池添加标签，可以标识云资源，便于快速搜索资源池。在资源池详情页，切换到“标签”页签。您可以查看、搜索、添加、修改、删除资源池的标签信息。最多支持添加20个标签。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
训练启动脚本说明和参数配置 - AI开发平台ModelArts

设置：需要遵循GBS/MBS的值能够被NPU/(TP×PP×CP)的值进行整除。模型推荐的参数与NPU卡数设置不同模型推荐的训练参数和计算规格要求如表2所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表2 不同模型推荐的参数与NPU卡数设置序号

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

设置：需要遵循GBS/MBS的值能够被NPU/(TP×PP×CP)的值进行整除。模型推荐的参数与NPU卡数设置不同模型推荐的训练参数和计算规格要求如表2所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表2 不同模型推荐的参数与NPU卡数设置序号

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.911） > 训练脚本说明
部署推理服务 - AI开发平台ModelArts

DEFER_MS=10 # 延迟解码时间，默认值为10，单位为ms。将Token解码延迟进行的毫秒数，使得当次Token解码能与下一次模型推理并行计算，从而减少总推理时延。该参数需要设置环境变量DEFER_DECODE=1才能生效。 export USE_VOCAB_PARALLEL=1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

Mindspore版本与CANN版本，CANN版本与Ascend驱动/固件版本均有严格的匹配关系，版本不匹配会导致训练失败。前提条件已注册华为账号并开通华为云，且在使用ModelArts前检查账号状态，账号不能处于欠费或冻结状态。 Step1 创建OBS桶和文件夹在OBS服务中创建桶和文件夹，用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
启动智能任务 - AI开发平台ModelArts

运行模型需要的环境变量键值对，可选填，默认为空。为确保您的数据安全，在环境变量中，请勿输入敏感信息。 instance_count 否 Integer 模型部署的实例数，即计算节点的个数。 model_id 否 String 模型ID。 specification 否 String 在线服务的资源规格。详见部署服务

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建ModelArts数据增强任务 - AI开发平台ModelArts

添加天气，模拟天气效果。 weather_mode：添加天气的模式，默认值为Rain。 Rain：下雨 Fog：雾 Snow：雪 Clouds：云 do_validation：数据扩增前是否进行数据校验。默认值为True。输入要求算子输入分为两种，“数据集”或“OBS目录”。选择

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
获取智能任务的信息 - AI开发平台ModelArts

运行模型需要的环境变量键值对，可选填，默认为空。为确保您的数据安全，在环境变量中，请勿输入敏感信息。 instance_count Integer 模型部署的实例数，即计算节点的个数。 model_id String 模型ID。 specification String 在线服务的资源规格。详见部署服务 weight

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
分页查询智能任务列表 - AI开发平台ModelArts

运行模型需要的环境变量键值对，可选填，默认为空。为确保您的数据安全，在环境变量中，请勿输入敏感信息。 instance_count Integer 模型部署的实例数，即计算节点的个数。 model_id String 模型ID。 specification String 在线服务的资源规格。详见部署服务 weight

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
开发环境的应用示例 - AI开发平台ModelArts

3600000, "type": "timing" } 其中，加粗的字段需要根据实际值填写： “duration”为实例运行时长，以创建时间为起点计算，即“创建时间+duration > 当前时刻”时，系统会自动停止实例。 “type”为自定停止类别，默认为timing。返回状态码为“

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例

总条数： 380

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练启动脚本说明和参数配置 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

CogVideoX模型基于DevServer适配PyTorch NPU全量训练指导（6.3.911） - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

错误码 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

查看Standard专属资源池详情 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

启动智能任务 - AI开发平台ModelArts

创建ModelArts数据增强任务 - AI开发平台ModelArts

获取智能任务的信息 - AI开发平台ModelArts

分页查询智能任务列表 - AI开发平台ModelArts

开发环境的应用示例 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线