搜索_华为云

LoRA微调训练 - AI开发平台ModelArts

Step1 创建训练任务创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及选择上传的镜像。代码目录选择：OBS桶路径下的llm_train/AscendSpeed代码目录。图1 创建训练作业如果镜像使用使用基础镜像中的基础镜像时，训练作业启动命令中输入：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）
创建智能标注作业 - AI开发平台ModelArts

“预标注”。“预标注”表示选择用户模型管理里面的模型，选择模型时需要注意模型类型和数据集的标注类型相匹配。预标注结束后，如果标注结果符合平台定义的标准标注格式，系统将进行难例筛选，该步骤不影响预标注结果。选择模型及版本 “我的AI应用”。您可以根据实际需求选择您的模型。您需要在目标AI应用的左侧单击下拉

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过智能标注方式标注数据
可视化作业 - AI开发平台ModelArts

创建可视化作业查询可视化作业列表查询可视化作业详情更新可视化作业描述删除可视化作业停止可视化作业重启可视化作业父主题：训练管理（旧版）

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版）
查询镜像详情 - AI开发平台ModelArts

AARCH64：ARM体系架构。 create_at Long 镜像创建的时间，UTC毫秒。 description String 该镜像所对应的描述信息，长度限制512个字符。 dev_services Array of strings 镜像支持的服务。枚举值如下： NOTEBOOK：镜像支持通过https协议访问Notebook。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询训练作业版本列表 - AI开发平台ModelArts

自定义镜像训练作业的自定义镜像的SWR-URL。 user_command String 自定义镜像训练作业的自定义镜像的容器的启动命令。 resource_id String 训练作业的计费资源ID。 dataset_name String 训练作业的数据集名称。 start_time Long 训练作业开始时间。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
查看Workflow工作流运行记录 - AI开发平台ModelArts

运行记录是展示某条工作流所有运行状态数据的地方。在Workflow列表页，单击某条工作流的名称，进入该工作流的详情页面。在工作流的详情页，左侧区域即为该条工作流的所有运行记录。图1 查看运行记录您可以对当前工作流的所有运行记录，进行删除、编辑以及重新运行的操作。删除：如果该条运行记

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
准备镜像环境 - AI开发平台ModelArts

同样，/mnt/sfs_turbo 也可以映射至容器中，作为容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。为方便访问两个地址可以相同。 ${pvc_name} 为在CCE集群关联SFS Turbo步骤中创建的PVC名称。在设置容器中需要的CPU与内存大小时，可通过运

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） > 准备工作
Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导（6.3.909） - AI开发平台ModelArts

3.909-xxx.zip软件包中的AscendCloud-AIGC-6.3.909-xxx.zip 说明：包名中的xxx表示具体的时间戳，以包名的实际时间为准。获取路径：Support-E 说明：如果没有下载权限，请联系您所在企业的华为方技术支持下载获取。基础镜像西南-贵阳一：

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导(6.3.906) - AI开发平台ModelArts

3.906-xxx.zip软件包中的AscendCloud-AIGC-6.3.906-xxx.zip 说明：包名中的xxx表示具体的时间戳，以包名的实际时间为准。获取路径：Support-E 说明：如果没有下载权限，请联系您所在企业的华为方技术支持下载获取。基础镜像西南-贵阳一：swr

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
LoRA微调训练 - AI开发平台ModelArts

创建训练任务创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及选择上传的镜像。代码目录选择：OBS桶路径下的 llm_train/AscendSpeed 代码目录。图1 创建训练作业若镜像使用使用基础镜像（二选一）中的基础镜像时，训练作业启动命令中输入：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
导出ModelArts数据集中的数据 - AI开发平台ModelArts

导出ModelArts数据集中的数据针对数据集中的数据，用户可以选中部分数据或者通过条件筛选出需要的数据，导出成新的数据集。用户可以通过任务历史查看数据导出的历史记录。目前只有“图像分类”、“物体检测”、“图像分割”类型的数据集支持导出功能。 “图像分类”只支持导出txt格式的标注文件。 “物体检测”只支持导出Pascal

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Service）与SFS Turbo文件系统联动，可以实现数据灵活管理、高性能读取数据等。通过OBS上传训练所需的模型文件、训练数据等，再将OBS中的数据文件导入到SFS Turbo，然后在训练作业中挂载SFS Turbo到容器对应ckpt目录，实现分布式读取训练数据文件。约束限制

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908）
资源和引擎规格接口 - AI开发平台ModelArts

资源和引擎规格接口查询作业资源规格查询作业引擎规格父主题：训练管理（旧版）

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版）
训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

Call to connect returned Connection refused, retrying”。原因分析 NCCL是一个提供GPU间通信原语的库，实现集合通信和点对点发送/接收原语。当训练作业出现NCCL的报错时，可以通过调整NCCL的环境变量尝试解决问题。处理步骤

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
处理ModelArts数据集中的数据 - AI开发平台ModelArts

处理ModelArts数据集中的数据数据处理场景介绍创建ModelArts数据校验任务创建ModelArts数据清洗任务创建ModelArts数据选择任务创建ModelArts数据增强任务管理和查看数据处理任务父主题：数据准备与处理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
训练作业运行失败排查指导 - AI开发平台ModelArts

sm_70'”。原因：训练作业使用的镜像CUDA版本只支持sm_37、sm_50、sm_60和sm_70的加速卡，不支持sm_80。处理建议：使用自定义镜像创建训练作业，并安装高版本的cuda以及对应的PyTorch版本。查看训练作业的“日志”，出现报错“ERROR:root:label_map

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
资源池监控 - AI开发平台ModelArts

s + durationInMinutes * 60 * 1000)计算结束时间，如果计算出的结束时间大于当前系统时间，则使用当前系统时间 durationInMinutes：查询时间的跨度分钟数。取值范围大于0并且大于等于(endTimeInMillis - startTimeInMillis)

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
模型调试 - AI开发平台ModelArts
模型调试 - AI开发平台ModelArts

在ModelArts Notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。将自定义的推理文件和模型配置文件保存在训练生成的模型文件目录下。如训练生成的模型保存在“/home/ma-user/work/tensorflow_mlp

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
训练的数据集预处理说明 - AI开发平台ModelArts

Response:" 自定义handler 参考MOSSMultiTurnHandler的实现，继承想要的通用的父类，实现_filter方法，然后在数据预处理的参数里指定自己的handler名称即可用户自定义执行数据处理脚本修改参数说明如果用户要自定义数据处理脚本并且单独执行，同样以

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考
SFT全参微调训练 - AI开发平台ModelArts

Step1 创建训练任务创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及选择上传的镜像。代码目录选择：OBS桶路径下的llm_train/AscendSpeed代码目录。图1 创建训练作业如果镜像使用使用基础镜像中的基础镜像时，训练作业启动命令中输入：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908）

总条数： 906

上一页
1
...
19
20
21
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

LoRA微调训练 - AI开发平台ModelArts

创建智能标注作业 - AI开发平台ModelArts

可视化作业 - AI开发平台ModelArts

查询镜像详情 - AI开发平台ModelArts

查询训练作业版本列表 - AI开发平台ModelArts

查看Workflow工作流运行记录 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导（6.3.909） - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导(6.3.906) - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

导出ModelArts数据集中的数据 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

资源和引擎规格接口 - AI开发平台ModelArts

训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

处理ModelArts数据集中的数据 - AI开发平台ModelArts

训练作业运行失败排查指导 - AI开发平台ModelArts

资源池监控 - AI开发平台ModelArts

模型调试 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线