搜索_华为云

训练启动脚本说明和参数配置 - AI开发平台ModelArts

表示张量并行。 PP 1 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

表示张量并行。 PP 8 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
执行训练任务（推荐） - AI开发平台ModelArts

768长度，则推荐增加此值（≥ 2）。（此参数目前仅适用于Llama3系列模型长序列训练） lr 2.5e-5 学习率设置。 min-lr 2.5e-6 最小学习率设置。 seq-length 4096 要处理的最大序列长度。 convert_mg2hf_at_last true

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
训练启动脚本说明和参数配置 - AI开发平台ModelArts

表示张量并行。 PP 1 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

表示张量并行。 PP 8 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明
查询单个智能标注样本的信息 - AI开发平台ModelArts

内置属性：图像尺寸（图像的宽度、高度、深度），类型为List[/topic/body/section/table/tgroup/tbody/row/entry/p/br {""}) (br]。列表中的第一个数字为宽度(像素)，第二个数字为高度(像素)，第三个数字为深度(深度可以没有，默认为3)，如[100

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
更新团队标注验收任务状态 - AI开发平台ModelArts

内置属性：图像尺寸（图像的宽度、高度、深度），类型为List[/topic/body/section/table/tgroup/tbody/row/entry/p/br {""}) (br]。列表中的第一个数字为宽度(像素)，第二个数字为高度(像素)，第三个数字为深度(深度可以没有，默认为3)，如[100

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询单个样本信息 - AI开发平台ModelArts

@modelarts:size Array of objects 内置属性：图像尺寸（图像的宽度、高度、深度），类型为List<Integer>。列表中的第一个数字为宽度(像素)，第二个数字为高度(像素)，第三个数字为深度(深度可以没有，默认为3)，如[100,200,3]和[100,200]均合法。说

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

如果是公共资源池，一般是由于其他用户占用资源导致。有以下方法可以尝试：如果使用的是免费规格，可以换成收费规格，免费规格资源较少，排队概率高。规格选择卡数尽量少，如可以选择1卡，相比于选择8卡排队几率大大降低。可以尝试使用其他Region（如北京四切换为上海一）。如果有

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
执行训练任务【新】 - AI开发平台ModelArts

768长度，则推荐增加此值（≥ 2）。（此参数目前仅适用于Llama3系列模型长序列训练） lr 2.5e-5 学习率设置。 min-lr 2.5e-6 最小学习率设置。 seq-length 4096 要处理的最大序列长度。 convert_mg2hf_at_last 1 M

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

镜像中已包含训练代码则不需要配置。需要提前将代码上传至OBS桶中，目录内文件总大小要小于或等于5GB，文件数要小于或等于1000个，文件深度要小于或等于32。训练代码文件会在训练作业启动的时候被系统自动下载到训练容器的“${MA_JOB_DIR}/demo-code”目录中，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
查询服务详情 - AI开发平台ModelArts

String 模型名称。 model_version String 模型版本。 source_type String 模型来源，当模型是由自动学习产生时，返回此字段，取值为：auto。 status String 模型实例运行状态，取值为： ready：已就绪（所有实例已启动） co

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
查询AI应用详情 - AI开发平台ModelArts

模型运行时环境。 model_metrics String 模型精度信息。 source_type String 模型来源的类型，仅当模型为自动学习部署过来时有值，取值为auto。 model_type String 模型类型，取值为TensorFlow/Image/PyTorch/Template/MindSpore。

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
查询团队标注的样本信息 - AI开发平台ModelArts

内置属性：图像尺寸（图像的宽度、高度、深度），类型为List[/topic/body/section/table/tgroup/tbody/row/entry/p/br {""}) (br]。列表中的第一个数字为宽度(像素)，第二个数字为高度(像素)，第三个数字为深度(深度可以没有，默认为3)，如[100

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询智能标注的样本列表 - AI开发平台ModelArts

内置属性：图像尺寸（图像的宽度、高度、深度），类型为List[/topic/body/section/table/tgroup/tbody/row/entry/p/br {""}) (br]。列表中的第一个数字为宽度(像素)，第二个数字为高度(像素)，第三个数字为深度(深度可以没有，默认为3)，如[100

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
投机推理使用说明 - AI开发平台ModelArts

小模型投机步数，即小模型生成几个token来交给大模型进行推理，取值通常在2~6之间，步数越小，每次校验的token越少，投机token与大模型一致的概率越高；反之，步数过大会导致与大模型无法保持一致，造成资源浪费。 offline speculative_draft_tensor_parallel_size

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
免费体验MaaS预置服务 - AI开发平台ModelArts

设置推理核采样。调整输出文本的多样性，数值越大，生成文本的多样性就越高。取值范围：0.1~1 默认值：1 top_k 选择在模型的输出结果中选择概率最高的前K个结果。取值范围：1~1000 默认值：20 当Tokens的免费调用额度使用完时，操作列的“在线体验”会置灰。方式二：在业务环境中调用模型服务的API进行推理。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

context-parallel-size 。（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考
使用MaaS调优模型 - AI开发平台ModelArts

取值范围：1~100000 学习率/learning_rate 设置每个迭代步数（iteration）模型参数/权重更新的速率。学习率设置得过高会导致模型难以收敛，过低则会导致模型收敛速度过慢。取值范围：0~0.1 默认值：0.00002 建议微调场景的学习率设置在10-5这个量级。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
执行训练任务（历史版本） - AI开发平台ModelArts

context-parallel-size 。（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务

总条数： 310

上一页
1
...
11
12
13
...
16
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

查询单个智能标注样本的信息 - AI开发平台ModelArts

更新团队标注验收任务状态 - AI开发平台ModelArts

查询单个样本信息 - AI开发平台ModelArts

ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

执行训练任务【新】 - AI开发平台ModelArts

已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

查询AI应用详情 - AI开发平台ModelArts

查询团队标注的样本信息 - AI开发平台ModelArts

查询智能标注的样本列表 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

免费体验MaaS预置服务 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线