搜索_华为云

创建AI应用失败，如何定位和处理问题？ - AI开发平台ModelArts

/usr/bin/sh: exec format error”。这种报错一般是因为所用镜像系统引擎和构建镜像的系统引擎不一致引起的，例如使用的是x86的镜像却标记的是arm的系统架构。可以通过查看AI应用详情看到配置的系统运行架构。基础镜像的系统架构详情可以参考推理基础镜像列表。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
训练的数据集预处理说明 - AI开发平台ModelArts

的存放路径，与HF权重存放在一个文件夹下。 --seq-length：要处理的最大seq length。 --workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
获取智能任务的信息 - AI开发平台ModelArts

Boolean 是否通过图片色彩来聚类。 inf_cluster_id String 专属集群ID，默认为空，不使用专属集群；使用专属集群部署服务时需确保集群状态正常；配置此参数后，则使用集群的网络配置，vpc_id参数不生效。 inf_config_list Array of InfConfig

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
预训练任务 - AI开发平台ModelArts

_pretrain_70b.sh 和0_pl_pretrain_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示。其他超参均有默认值，可以参考表1按照实际需求修改。表1 训练超参配置说明参数示例值参数说明 ORIGINAL_TRAIN_DATA_PATH

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）
准备Notebook（可选） - AI开发平台ModelArts

会被保留。可以自定义磁盘空间，如果需要存储数据集、模型等大型文件，建议申请规格300GB+。存储支持在线按需扩容。图2 自定义存储配置使用Notebook将OBS数据导入云硬盘EVS 打开已创建的Notebook实例，选择Notebook的python-3.9.10，即可编辑Untitled

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作
查询作业引擎规格 - AI开发平台ModelArts

Long 训练作业的引擎ID。 engine_name String 训练作业的引擎名称。 engine_version String 训练作业使用的引擎版本。请求示例如下以查看训练作业的资引擎规格为例。 GET https://endpoint/v1/{project_id}/job/ai-engines

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 资源和引擎规格接口
查询数据集的统计信息 - AI开发平台ModelArts

objects 标签的多维度属性，如标签为“音乐”，可能包含属性“风格”、“歌手”等。 count Integer 该标签的打标数量。 name String 标签名称。 property LabelProperty object 标签基本属性键值对，如颜色、快捷键等。 sample_count

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建导入任务 - AI开发平台ModelArts

LabelAttribute objects 标签的多维度属性，如标签为“音乐”，可能包含属性“风格”、“歌手”等。 name 否 String 标签名称。 property 否 LabelProperty object 标签基本属性键值对，如颜色、快捷键等。 type 否 Integer 标签类型。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
附录：指令微调训练常见问题 - AI开发平台ModelArts

_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考各个模型深度学习训练加速框架的选择，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Deepspeed-ZeRO-1替换为Deepspeed-ZeRO-2以此类推，重新训练如未解决则执行下一步。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
查看日志和性能 - AI开发平台ModelArts

loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。loss收敛图存放路径对应表1表格中output_dir参数值路径下的training_loss.png中也可以使用可视化工具TrainingLogParser查看loss收敛情况，将trainer_log.jsonl文件长传至可视化工具页面，如图2所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

示例值需要根据数据集的不同，选择其一。 GeneralPretrainHandler：使用预训练的alpaca数据集。 GeneralInstructionHandler：使用微调的alpaca数据集。 MOSSInstructionHandler：使用微调的moss数据集。 MBS 1 表示流水线并行中一个micro

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

示例值需要根据数据集的不同，选择其一。 GeneralPretrainHandler：使用预训练的alpaca数据集。 GeneralInstructionHandler：使用微调的alpaca数据集。 MOSSMultiTurnHandler：使用微调的moss数据集。 MBS 4 表示流水线并行中一个micro

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
删除API - AI开发平台ModelArts
删除API - AI开发平台ModelArts

描述 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。请求参数表3 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
准备Notebook（可选） - AI开发平台ModelArts

会被保留。可以自定义磁盘空间，如果需要存储数据集、模型等大型文件，建议申请规格300GB+。存储支持在线按需扩容。图2 自定义存储配置使用Notebook将OBS数据导入云硬盘EVS 打开已创建的Notebook实例，选择Notebook的python-3.9.10，即可编辑Untitled

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 准备工作
管理团队和团队成员 - AI开发平台ModelArts

“角色”支持“Labeler”、“Reviewer”和“Team Manager”，“Team Manager”只能设置为一个人。删除团队当已有的团队不再使用，您可以执行删除操作。在“标注团队”管理页面中，选中需删除的团队，然后单击“删除”。在弹出的对话框中，确认信息无误后，单击“确定”完成团队删除。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
更新训练作业参数 - AI开发平台ModelArts

训练作业的输出文件OBS路径URL，默认为空，如“/usr/train/”。 log_url 否 String 训练作业的日志OBS输出路径URL，默认为空。如：“/usr/train/”。 user_image_url 否 String 自定义镜像训练作业的自定义镜像的SWR-URL。如：“100.125

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
训练启动脚本说明和参数配置 - AI开发平台ModelArts

示例值需要根据数据集的不同，选择其一。 GeneralPretrainHandler：使用预训练的alpaca数据集。 GeneralInstructionHandler：使用微调的alpaca数据集。 MOSSMultiTurnHandler：使用微调的moss数据集。 MBS 4 表示流水线并行中一个micro

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

示例值需要根据数据集的不同，选择其一。 GeneralPretrainHandler：使用预训练的alpaca数据集。 GeneralInstructionHandler：使用微调的alpaca数据集。 MOSSInstructionHandler：使用微调的moss数据集。 MBS 1 表示流水线并行中一个micro

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
查询AI应用列表 - AI开发平台ModelArts

递减排序，默认值 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。 model_type 否 String 模型类型，查询属于该类型的模型列表。model_type与not_m

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
查询团队标注任务统计信息 - AI开发平台ModelArts

objects 标签的多维度属性，如标签为“音乐”，可能包含属性“风格”、“歌手”等。 count Integer 该标签的打标数量。 name String 标签名称。 property LabelProperty object 标签基本属性键值对，如颜色、快捷键等。 sample_count

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）

总条数： 1814

上一页
1
...
86
87
88
...
91
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建AI应用失败，如何定位和处理问题？ - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

获取智能任务的信息 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

准备Notebook（可选） - AI开发平台ModelArts

查询作业引擎规格 - AI开发平台ModelArts

查询数据集的统计信息 - AI开发平台ModelArts

创建导入任务 - AI开发平台ModelArts

附录：指令微调训练常见问题 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

删除API - AI开发平台ModelArts

准备Notebook（可选） - AI开发平台ModelArts

管理团队和团队成员 - AI开发平台ModelArts

更新训练作业参数 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

查询AI应用列表 - AI开发平台ModelArts

查询团队标注任务统计信息 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线