搜索_华为云

训练的数据集预处理说明 - AI开发平台ModelArts

现_filter方法，然后在数据预处理的参数里指定自己的handler名称即可用户自定义执行数据处理脚本修改参数说明如果用户要自定义数据处理脚本并且单独执行，同样以llama2为例。方法一：用户可打开scripts/llama2/1_preprocess_data.sh脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

_filter方法，然后在数据预处理的参数里指定自己的handler名称即可用户自定义执行数据处理脚本修改参数说明如果用户要自定义数据处理脚本并且单独执行，同样以 llama2 为例。方法一：用户可打开scripts/llama2/1_preprocess_data.sh脚

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考
创建单机多卡的分布式训练（DataParallel） - AI开发平台ModelArts

创建单机多卡的分布式训练（DataParallel）本章节介绍基于PyTorch引擎的单机多卡数据并行训练。 MindSpore引擎的分布式训练参见MindSpore官网。训练流程简述单机多卡数据并行训练流程介绍如下：将模型复制到多个GPU上将一个Batch的数据均分到每一个GPU上

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
从OBS导入数据到ModelArts数据集 - AI开发平台ModelArts

从OBS导入数据到ModelArts数据集从OBS导入数据到数据集场景介绍从OBS目录导入数据到数据集从Manifest文件导入数据到数据集从OBS目录导入数据规范说明从Manifest文件导入规范说明父主题：导入数据到ModelArts数据集

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集
使用自动学习实现声音分类 - AI开发平台ModelArts

使用自动学习实现声音分类准备声音分类数据创建声音分类项目标注声音分类数据训练声音分类模型部署声音分类服务父主题：使用自动学习实现零代码AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发
使用自动学习实现文本分类 - AI开发平台ModelArts

使用自动学习实现文本分类准备文本分类数据创建文本分类项目标注文本分类数据训练文本分类模型部署文本分类服务父主题：使用自动学习实现零代码AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发
构建Workflow多分支运行场景 - AI开发平台ModelArts

构建Workflow多分支运行场景 Workflow多分支运行介绍构建条件节点控制分支执行配置节点参数控制分支执行配置多分支节点数据父主题：开发Workflow命令参考

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
使用自动学习实现物体检测 - AI开发平台ModelArts

使用自动学习实现物体检测准备物体检测数据创建物体检测项目标注物体检测数据训练物体检测模型部署物体检测服务父主题：使用自动学习实现零代码AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发
精度调优总体思路 - AI开发平台ModelArts

PyTorch大模型训练的精度问题的分析、定位可以参考如下思路：大模型训练通常使用多机训练，鉴于多机训练复现问题的成本较高，且影响因子较多，建议用户先减少模型层数，使模型能够单机训练，确认单机训练是否也存在精度问题，若存在，则使用下述手段定位精度问题，使得单机精度达标，然后再恢复层数拉起多机训练。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
训练的数据集预处理说明 - AI开发平台ModelArts

现_filter方法，然后在数据预处理的参数里指定自己的handler名称即可用户自定义执行数据处理脚本修改参数说明如果用户要自定义数据处理脚本并且单独执行，同样以llama2为例。方法一：用户可打开scripts/llama2/1_preprocess_data.sh脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

现_filter方法，然后在数据预处理的参数里指定自己的handler名称即可用户自定义执行数据处理脚本修改参数说明如果用户要自定义数据处理脚本并且单独执行，同样以llama2为例。方法一：用户可打开scripts/llama2/1_preprocess_data.sh脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明
用户结束kernelgateway进程后报错Server Connection Error，如何恢复？ - AI开发平台ModelArts

用户结束kernelgateway进程后报错Server Connection Error，如何恢复？问题现象当kernelgateway进程被结束后，出现如下报错，以及选不到Kernel。图1 报错Server Connection Error截图图2 选不到Kernel

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
Lite Server算力资源和镜像版本配套关系 - AI开发平台ModelArts

Lite Server算力资源和镜像版本配套关系 Lite Server提供多种NPU、GPU镜像，您可在购买前了解当前支持的镜像及对应详情。 NPU Snt9裸金属服务器支持的镜像详情镜像名称：ModelArts-Euler2.8_Aarch64_Snt9_C78 表1 镜像详情

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
使用自动学习实现图像分类 - AI开发平台ModelArts

使用自动学习实现图像分类准备图像分类数据创建图像分类项目标注图像分类数据训练图像分类模型部署图像分类服务父主题：使用自动学习实现零代码AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发
训练的数据集预处理说明 - AI开发平台ModelArts

dler名称即可用户自定义执行数据处理脚本修改参数说明同样以 llama2 为例，用户可直接编辑 scripts/llama2/1_preprocess_data.sh 脚本，自定义环境变量的值，并运行该脚本。其中环境变量详细介绍如下：表1 数据预处理中的环境变量环境变量

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

dler名称即可用户自定义执行数据处理脚本修改参数说明同样以 llama2 为例，用户可直接编辑 scripts/llama2/1_preprocess_data.sh 脚本，自定义环境变量的值，并运行该脚本。其中环境变量详细介绍如下：表1 数据预处理中的环境变量环境变量

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明
精度校验 - AI开发平台ModelArts
精度校验 - AI开发平台ModelArts

99表示余弦相似度至少为99%，--inputShapes可将模型放入到netron官网中查看。图1 benchmark对接结果输出示例图为了简化用户使用，ModelArts提供了Tailor工具便于用户进行Benchmark精度测试，具体使用方式参考Tailor指导文档。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
训练的数据集预处理说明 - AI开发平台ModelArts

GeneralPretrainHandler：默认值。用于预训练时的数据预处理过程中，将数据集根据key值进行简单的过滤。 GeneralInstructionHandler：用于sft、lora微调时的数据预处理过程中，会对数据集full_prompt中的user_prompt进行mask操作。 --seq-length：要处理的最大seq

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
Standard Workflow - AI开发平台ModelArts

针对工作流开发，Workflow提供流水线需要覆盖的功能以及功能需要的参数描述，供用户使用SDK对步骤以及步骤之间的关系进行定义针对工作流复用，用户可以在开发完成后将流水线固化下来，提供下次或其他人员使用，同时无需关注流水线中包含什么算法或如何实现图1 Workflow流程父主题： Standard功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
日志提示“no socket interface found” - AI开发平台ModelArts

偶发上述现象。原因2：NCCL_SOCKET_IFNAME设置错误。当用户的NCCL版本低于2.14时，则需要手动设置NCCL_SOCKET_IFNAME环境变量。处理方法针对原因1，需要在代码中补充如下环境变量。 import os os.environ["NCCL_IB_TC"]

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题

总条数： 2470

上一页
1
...
96
97
98
...
124
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

创建单机多卡的分布式训练（DataParallel） - AI开发平台ModelArts

从OBS导入数据到ModelArts数据集 - AI开发平台ModelArts

使用自动学习实现声音分类 - AI开发平台ModelArts

使用自动学习实现文本分类 - AI开发平台ModelArts

构建Workflow多分支运行场景 - AI开发平台ModelArts

使用自动学习实现物体检测 - AI开发平台ModelArts

精度调优总体思路 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

用户结束kernelgateway进程后报错Server Connection Error，如何恢复？ - AI开发平台ModelArts

Lite Server算力资源和镜像版本配套关系 - AI开发平台ModelArts

使用自动学习实现图像分类 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

精度校验 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

Standard Workflow - AI开发平台ModelArts

日志提示“no socket interface found” - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线