搜索_华为云

SFT全参微调训练 - AI开发平台ModelArts

context-parallel-size 。（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
与其他云服务的关系 - AI开发平台ModelArts

多信息请参见《对象存储服务产品文档》。表1 ModelArts各环节与OBS的关系功能子任务 ModelArts与OBS的关系自动学习数据标注 ModelArts标注的数据存储在OBS中。自动训练训练作业结束后，其生成的模型存储在OBS中。部署上线 ModelAr

帮助中心 > AI开发平台ModelArts > 产品介绍
ModelArts与其他服务的关系 - AI开发平台ModelArts

信息请参见《对象存储服务控制台指南》。表1 ModelArts各环节与OBS的关系功能子任务 ModelArts与OBS的关系自动学习数据标注 ModelArts标注的数据存储在OBS中。自动训练训练作业结束后，其生成的模型存储在OBS中。部署上线 ModelAr

帮助中心 > AI开发平台ModelArts > 常见问题 > 历史文档待下线
训练启动脚本说明和参数配置 - AI开发平台ModelArts

表示张量并行。 PP 1 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
LoRA微调训练 - AI开发平台ModelArts

context-parallel-size 。（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
业务代码问题 - AI开发平台ModelArts

分布式Tensorflow无法使用“tf.variable” MXNet创建kvstore时程序被阻塞，无报错日志出现ECC错误，导致训练作业失败超过最大递归深度导致训练作业失败使用预置算法训练时，训练失败，报“bndbox”错误训练作业进程异常退出训练作业进程被kill 父主题：训练作业

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
查询模型详情 - AI开发平台ModelArts

source_job_version String 来源训练作业的版本。 source_type String 模型来源的类型。当模型为自动学习部署过来时，取值为“auto”。当模型是用户通过训练作业或OBS模型文件部署时，此值为空。 model_type String 模型类型

 帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
约束与限制 - AI开发平台ModelArts

属资源池容器引擎空间不会造成额外费用增加。更多信息，请参见导入AI应用对镜像大小的约束限制。自动学习项目中，在完成模型部署后，其生成的模型也将自动上传至模型列表中。但是自动学习生成的模型无法下载，只能用于部署上线。 Standard推理服务部署只支持使用专属资源池部署的在线

 帮助中心 > AI开发平台ModelArts > 产品介绍
自动模型优化介绍 - AI开发平台ModelArts

float，一般不建议用户修改 TPE算法 TPE算法全称Tree-structured Parzen Estimator，是一种利用高斯混合模型来学习超参模型的算法。在每次试验中，对于每个超参，TPE为与最佳目标值相关的超参维护一个高斯混合模型l(x)，为剩余的超参维护另一个高斯混合模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 自动模型优化（AutoSearch）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

表示张量并行。 PP 1 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

表示张量并行。 PP 8 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

表示张量并行。 PP 8 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

表示张量并行。 PP 1 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
执行训练任务（推荐） - AI开发平台ModelArts

768长度，则推荐增加此值（≥ 2）。（此参数目前仅适用于Llama3系列模型长序列训练） lr 2.5e-5 学习率设置。 min-lr 2.5e-6 最小学习率设置。 seq-length 4096 要处理的最大序列长度。 convert_mg2hf_at_last true

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
执行训练任务【新】 - AI开发平台ModelArts

768长度，则推荐增加此值（≥ 2）。（此参数目前仅适用于Llama3系列模型长序列训练） lr 2.5e-5 学习率设置。 min-lr 2.5e-6 最小学习率设置。 seq-length 4096 要处理的最大序列长度。 convert_mg2hf_at_last 1 M

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
使用MaaS调优模型 - AI开发平台ModelArts

取值范围：1~100000 学习率/learning_rate 设置每个迭代步数（iteration）模型参数/权重更新的速率。学习率设置得过高会导致模型难以收敛，过低则会导致模型收敛速度过慢。取值范围：0~0.1 默认值：0.00002 建议微调场景的学习率设置在10-5这个量级。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
查询服务详情 - AI开发平台ModelArts

String 模型名称。 model_version String 模型版本。 source_type String 模型来源，当模型是由自动学习产生时，返回此字段，取值为：auto。 status String 模型实例运行状态，取值为： ready：已就绪（所有实例已启动） co

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
查询AI应用详情 - AI开发平台ModelArts

模型运行时环境。 model_metrics String 模型精度信息。 source_type String 模型来源的类型，仅当模型为自动学习部署过来时有值，取值为auto。 model_type String 模型类型，取值为TensorFlow/Image/PyTorch/Template/MindSpore。

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
场景介绍及环境准备 - AI开发平台ModelArts

调试场景。环境开通指导请参考Notebook环境创建。 ModelArts Lite DevServer 该环境为裸机开发环境，主要面向深度定制化开发场景。环境开通指导请参考DevServer资源开通；环境配置指导请参考Snt9B裸金属服务器环境配置指南。本文基于ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型Pytorch迁移与精度性能调优
训练启动脚本说明和参数配置 - AI开发平台ModelArts

context-parallel-size 。（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考

总条数： 274

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SFT全参微调训练 - AI开发平台ModelArts

与其他云服务的关系 - AI开发平台ModelArts

ModelArts与其他服务的关系 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

业务代码问题 - AI开发平台ModelArts

查询模型详情 - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

自动模型优化介绍 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

执行训练任务【新】 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

查询AI应用详情 - AI开发平台ModelArts

场景介绍及环境准备 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线