搜索_华为云

训练的数据集预处理说明 - AI开发平台ModelArts

在一个文件夹下。 --seq-length：要处理的最大seq length。 --workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

在一个文件夹下。 --seq-length：要处理的最大seq length。 --workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 训练脚本说明
创建Standard专属资源池 - AI开发平台ModelArts

建成功后，在详情页的“节点”页签中查看。当前部分规格为受限购买（如Ascend规格），需要提前联系客户经理申请开通资源规格，预计1~3个工作日内开通（如果无客户经理可提交工单反馈）。可用区您可以根据实际情况选择“随机分配”或“指定AZ”。可用区是在同一区域下，电力、网络隔离

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
训练的数据集预处理说明 - AI开发平台ModelArts

在一个文件夹下。 --seq-length：要处理的最大seq length。 --workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考
查询训练作业列表 - AI开发平台ModelArts

应的“asc”，升序排序。 group_by String 查询作业要搜索的分组条件。 workspace_id String 作业所处的工作空间，默认值为“0”。 ai_project String 作业所属的AI项目，默认值为"default-ai-project"。 items

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
配置ModelArts委托授权 - AI开发平台ModelArts

“新增委托 > 委托名称” 系统自动创建委托名称，用户可以手动修改。 “新增委托 > 授权方式” 角色授权：IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机制以服务为粒度，提供有限的服务相关角色用于授权。由于华为云各服务之间存在业务依赖关系，因此给用户授予角色

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

各模型支持的卡数请参见附录：基于vLLM不同模型推理支持最小卡数和最大序列说明章节。操作流程图1 操作流程图表2 操作任务流程说明阶段任务说明准备工作准备资源本教程案例是基于ModelArts Standard运行，需要购买ModelArts专属资源池。准备权重准备对应模型的权重文件。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
Open-Sora1.2基于DevServer适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

${work_dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统，work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文件。container_dir为要挂载到的容器中的目录。为方便两个地址可以相同。 driver及npu-smi需同时挂载至容器。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

模型场景（512卡及以上）使用ranktable路由加速。脚本执行目录不能是共享目录，否则ranktable路由加速会失败。路由加速的原理是改变rank编号，所以代码中对rank的使用要统一，如果rank的使用不一致会导致训练异常。操作步骤开启ModelArts Lite

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
Yaml配置文件参数配置说明 - AI开发平台ModelArts

盖缓存。这通常在数据集发生变化，或者需要重新生成缓存时使用 preprocessing_num_workers 16 用于指定预处理数据的工作线程数。随着线程数的增加，预处理的速度也会提高，但也会增加内存的使用。 per_device_train_batch_size 1 指定每个设备的训练批次大小。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
查询数据集导出任务列表 - AI开发平台ModelArts

export_new_dataset_name String 导出新数据集的名称。 export_new_dataset_work_path String 导出新数据集的工作目录。 ratio_sample_usage Boolean 指定切分比例后，是否按指定比例随机分配训练-验证集。可选值如下： true：主动随机分配训练集-验证集

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

g --uid String 否自定义镜像运行的UID，默认值1000。 --working-dir String 否运行算法时所在的工作目录。 --local-code-dir String 否算法的代码目录下载到训练容器内的本地路径。 --user-command String

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
moondream2基于DevServer适配PyTorch NPU推理指导 - AI开发平台ModelArts

${work_dir}:${container_work_dir}：代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。容器不

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
部署模型为在线服务 - AI开发平台ModelArts

、“bmp”、“gif”、“webp”、“psd”、“svg”、“tiff”。如果服务部署时使用的是“Ascend”规格，则无法预测含有透明度的PNG图片，因为Ascend仅支持RGB-3通道的图片。该功能为调测使用，实际生产建议使用API调用。根据鉴权方式的不同，可以根据实

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

/home/ma-user/sdxl-train/user-job-dir/code/diffusers_finetune_train.sh 本地代码目录：保持默认即可。工作目录：选择代码文件目录，例如/home/ma-user/sdxl-train/user-job-dir/code/。输出：单击“增加训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

各模型支持的卡数请参见附录：基于vLLM不同模型推理支持最小卡数和最大序列说明章节。操作流程图1 操作流程图表2 操作任务流程说明阶段任务说明准备工作准备资源本教程案例是基于ModelArts Standard运行，需要购买ModelArts专属资源池。准备权重准备对应模型的权重文件。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

各模型支持的卡数请参见附录：基于vLLM不同模型推理支持最小卡数和最大序列说明章节。操作流程图1 操作流程图表2 操作任务流程说明阶段任务说明准备工作准备资源本教程案例是基于ModelArts Standard运行，需要购买ModelArts专属资源池。准备权重准备对应模型的权重文件。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

b的Launcher界面。图1 打开后进入JupyterLab的Launcher界面通过功能，上传模型包文件到Notebook中，默认工作目录/home/ma-user/work/。模型包文件需要用户自己准备，样例内容参见模型包文件样例。图2 上传模型包打开Terminal终端，解压model

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
创建训练作业 - AI开发平台ModelArts

v1兼容模式下，当前字段不生效。当code_dir以file://为前缀时，当前字段不生效。 working_dir 否 String 运行算法时所在的工作目录。规则：v1兼容模式下，当前字段不生效。 job_description 否 String 训练作业的描述。 volumes 否 JSON

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
Yaml配置文件参数配置说明 - AI开发平台ModelArts

盖缓存。这通常在数据集发生变化，或者需要重新生成缓存时使用 preprocessing_num_workers 16 用于指定预处理数据的工作线程数。随着线程数的增加，预处理的速度也会提高，但也会增加内存的使用。 per_device_train_batch_size 1 指定每个设备的训练批次大小。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明

总条数： 833

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

创建Standard专属资源池 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

配置ModelArts委托授权 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

Open-Sora1.2基于DevServer适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

查询数据集导出任务列表 - AI开发平台ModelArts

ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

moondream2基于DevServer适配PyTorch NPU推理指导 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线