搜索_华为云

预训练任务 - AI开发平台ModelArts

0_pl_pretrain_70b.sh 和 0_pl_pretrain_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示。其他超参均有默认值，可以参考表1按照实际需求修改。表1 必须修改的训练超参配置参数示例值参数说明 ORIGINAL_TRAIN_DATA_PATH

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
SFT全参微调训练任务 - AI开发平台ModelArts

执行脚本为0_pl_sft_70b.sh 和 0_pl_sft_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示。其他超参均有默认值，可以参考表1按照实际需求修改。表1 必须修改的训练超参配置参数示例值参数说明 ORIGINAL_TRAIN_DATA_PATH

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
Tensorflow多节点作业下载数据到/cache显示No space left - AI开发平台ModelArts

he”，实际下载的数据会翻倍。例如只下载了2.5TB的数据，程序就显示空间不够而失败，因为/cache只有4TB的可用空间。处理方法在使用Tensorflow多节点作业下载数据时，正确的下载逻辑如下： import argparse parser = argparse.ArgumentParser()

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
如何将两个数据集合并？ - AI开发平台ModelArts

在数据集C中，执行导入数据操作，将数据集A和数据集B的Manifest文件导入。导入完成后，即将数据集A和数据集B的数据分别都合并至数据集C中。如需使用合并后的数据集，再针对数据集C执行发布操作即可。父主题： Standard数据管理

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
开启训练故障自动重启功能 - AI开发平台ModelArts

自动从训练中断的位置接续训练，加载中断生成的checkpoint，中间不需要改动任何参数（支持预训练、LoRA微调、SFT微调）。如果要使用自动重启功能，资源规格必须选择八卡规格。当前功能还处于试验阶段，只有llama3-8B/70B适配。父主题：主流开源大模型基于Standard适配PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
自动学习项目中，如何进行增量训练？ - AI开发平台ModelArts

练版本”中选择之前已完成的训练版本，在此版本基础上进行增量训练。其他参数请根据界面提示填写。设置完成后，单击“确定”，即进行增量训练。系统将自动跳转至“模型训练”页面，待训练完成后，您可以在此页面中查看训练详情，如“训练精度”、“评估结果”、“训练参数”等。图1 选择增量训练版本

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
查询预置算法 - AI开发平台ModelArts

模型大小，单位为字节(Byte)。 model_train_dataset String 模型训练数据集。 model_dataset_format String 使用模型需要的数据集格式。 model_description_url String 模型描述链接。 parameter String 模型的

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
删除服务 - AI开发平台ModelArts
删除服务 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。 service_id 是 String 服务ID，如需批量删除多个服务，则将多个service_id使用英文半角逗号拼接。请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
ModelArts环境挂载目录说明 - AI开发平台ModelArts

rnetes.io/serviceaccount 是 / 训练任务表2 训练任务挂载点介绍挂载点是否只读备注 /xxx 否专属池使用SFS盘挂载的目录，路径由客户自己指定。 /home/ma-user/modelarts 否空文件夹，建议用户主要用这个目录。 /cache

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
预训练任务 - AI开发平台ModelArts

0_pl_pretrain_70b.sh 和 0_pl_pretrain_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示。其他超参均有默认值，可以参考表1按照实际需求修改。表1 必须修改的训练超参配置参数示例值参数说明 ORIGINAL_TRAIN_DATA_PATH

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
查询算法列表 - AI开发平台ModelArts

searches 否 String 查询算法所要过滤的条件，如算法名称模糊匹配。 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。请求参数无响应参数状态码：

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询训练作业版本详情 - AI开发平台ModelArts

(NAS) 训练本地挂载路径。如：“/home/work/nas”。 nas_share_addr String SFS Turbo (NAS) 共享路径。如：“192.168.8.150:/”。 nas_type String 当前仅支持 nfs。如：“nfs”。表3 parameter属性列表

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
创建资源池 - AI开发平台ModelArts

空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。 os.modelarts/name String 用户指定的pool名称。 os.modelarts/resource.id String 资源池的主资源id，通常提供给cbc使用。 os.modelarts/tenant

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
解除API对APP的授权 - AI开发平台ModelArts

描述 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。请求参数表3 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
查询数据集标签列表 - AI开发平台ModelArts

LabelAttribute objects 标签的多维度属性，如标签为“音乐”，可能包含属性“风格”、“歌手”等。 name String 标签名称。 property LabelProperty object 标签基本属性键值对，如颜色、快捷键等。 type Integer 标签类型。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
AI应用计费项 - AI开发平台ModelArts

存储到OBS中的数据需在OBS控制台进行手动删除。如果未删除，则会按照OBS的计费规则进行持续计费。按需计费包年/包月创建桶不收取费用，按实际使用的存储容量和时长收费计费示例示例：存储费用假设用户于2023年4月1日10:00将创建AI应用需用到的模型包文件上传至OBS桶中。按

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
训练作业进程被kill - AI开发平台ModelArts

在解压大量文件可能会出现此情况并造成节点重启。可以适当在解压大量文件时，加入sleep。比如每解压1w个文件，就停止1s。存储限制根据规格情况合理使用数据盘，数据盘大小请参考训练环境中不同规格资源大小。 CPU过载减少线程数。排查办法根据错误信息判断，报错原因来源于用户代码。您可以通过以下两种方式排查：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
获取样本搜索条件 - AI开发平台ModelArts

LabelAttribute objects 标签的多维度属性，如标签为“音乐”，可能包含属性“风格”、“歌手”等。 name String 标签名称。 property LabelProperty object 标签基本属性键值对，如颜色、快捷键等。 type Integer 标签类型。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
更新资源池 - AI开发平台ModelArts

空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。 os.modelarts/name String 用户指定的pool名称。 os.modelarts/resource.id String 资源池的主资源id，通常提供给cbc使用。 os.modelarts/tenant

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查看日志和性能 - AI开发平台ModelArts

参数查看表1。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。也可以使用可视化工具TrainingLogParser查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）

总条数： 1812

上一页
1
...
83
84
85
...
91
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

预训练任务 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

Tensorflow多节点作业下载数据到/cache显示No space left - AI开发平台ModelArts

如何将两个数据集合并？ - AI开发平台ModelArts

开启训练故障自动重启功能 - AI开发平台ModelArts

自动学习项目中，如何进行增量训练？ - AI开发平台ModelArts

查询预置算法 - AI开发平台ModelArts

删除服务 - AI开发平台ModelArts

ModelArts环境挂载目录说明 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

查询算法列表 - AI开发平台ModelArts

查询训练作业版本详情 - AI开发平台ModelArts

创建资源池 - AI开发平台ModelArts

解除API对APP的授权 - AI开发平台ModelArts

查询数据集标签列表 - AI开发平台ModelArts

AI应用计费项 - AI开发平台ModelArts

训练作业进程被kill - AI开发平台ModelArts

获取样本搜索条件 - AI开发平台ModelArts

更新资源池 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线