搜索_华为云

创建ModelArts数据选择任务 - AI开发平台ModelArts

集名称”和“数据集版本”；设置为“OBS目录”时，需填写正确的OBS路径。图2 输入输出设置-数据集图3 输入输出设置-OBS目录确认参数填写无误后，单击“创建”，完成数据处理任务的创建。数据去重算子（SimDeduplication算子）可以依据用户设置的相似程度阈值

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
ECS获取和上传基础镜像 - AI开发平台ModelArts

检查docker是否安装。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
创建ModelArts数据校验任务 - AI开发平台ModelArts

设置数据处理类型为“数据清洗”，填写相应算子的设置参数，算子的详细参数参见数据校验算子说明（MetaValidation算子）。图2 设置场景类别和数据处理类型设置输入与输出。需根据实际数据情况选择“数据集”或“OBS目录”。设置为“数据集”时，需填写“数据集名称”和“数据集版本”；设置为“OBS目录”时，需填写正确的OBS路径。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
创建ModelArts数据清洗任务 - AI开发平台ModelArts

应算子的设置参数，算子的详细参数参见数据清洗算子（PCC算子）。图2 设置场景类别和数据处理类型设置输入与输出。需根据实际数据情况选择“数据集”或“OBS目录”。设置为“数据集”时，需填写“数据集名称”和“数据集版本”；设置为“OBS目录”时，需填写正确的OBS路径。图3 输入输出设置-数据集

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
创建ModelArts数据增强任务 - AI开发平台ModelArts

“数据集名称”和“数据集版本”；设置为“OBS目录”时，需填写正确的OBS路径。图2 输入输出设置-数据集图3 输入输出设置-OBS目录确认参数填写无误后，单击“创建”，完成数据处理任务的创建。数据扩增算子说明数据扩增主要用于训练数据集不足或需要仿真的场景，能通过对已标

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
在Workflow中更新已部署的服务 - AI开发平台ModelArts

obs_config=wf.data.OBSOutputConfig(obs_path=output_storage.join("/train_output/")))], spec=wf.steps.JobSpec( resource=wf

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练脚本参数说明不同模型推荐的参数与NPU卡数设置训练tokenizer文件说明父主题： Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
构建Workflow多分支运行场景 - AI开发平台ModelArts

构建Workflow多分支运行场景 Workflow多分支运行介绍构建条件节点控制分支执行配置节点参数控制分支执行配置多分支节点数据父主题：开发Workflow命令参考

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
查询训练作业列表 - AI开发平台ModelArts

数据实际输出信息。表24 remote 参数参数类型描述 obs obs object 数据实际输出到OBS。表25 obs 参数参数类型描述 obs_url String 数据实际输出到OBS的路径。表26 engine 参数参数类型描述 engine_id String

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
ECS中构建新镜像 - AI开发平台ModelArts

d> 执行以下命令制作训练镜像。安装过程需要连接互联网git clone，请确保ECS可以访问公网 docker build -t <镜像名称>:<版本名称> . 图1 docker镜像构建过程如果无法访问公网，则可以配置代理，增加`--build-arg`参数指定代理地址，可访问公网。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
ECS中构建新镜像 - AI开发平台ModelArts

d> 执行以下命令制作训练镜像。安装过程需要连接互联网git clone，请确保ECS可以访问公网 docker build -t <镜像名称>:<版本名称> . 图1 docker镜像构建过程如果无法访问公网，则可以配置代理，增加`--build-arg`参数指定代理地址，可访问公网。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
使用MoXing复制数据报错 - AI开发平台ModelArts

将所需的数据上传至此OBS桶中。检查OBS的路径是否正确，是否写为了“obs://xxx”。可使用如下方式判断OBS路径是否存在。 mox.file.exists('obs://bucket_name/sub_dir_0/sub_dir_1') 路径存在，请执行4。路径不存在，请在更换为一个可用的OBS路径。

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
查看日志和性能 - AI开发平台ModelArts

size（GBS）、seq_len（SEQ_LEN）为训练时设置的参数。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。图2 查看日志和性能父主题： Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

选择用于训练的自定义镜像。 “代码目录” 执行本次训练作业所需的代码目录。本文示例的代码目录为“obs://test-modelarts/ascend/code/”。 “启动命令” 镜像的Python启动命令。本文示例的启动命令为“bash ${MA_JOB_DIR}/code/run_torch_ddp_npu

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
创建模型不同方式的场景介绍 - AI开发平台ModelArts

在得到满意的模型后，可以将训练后得到的模型创建为模型，用于部署服务。从OBS中导入模型文件创建模型：如果您使用常用框架在本地完成模型开发和训练，可以将本地的模型按照模型包规范上传至OBS桶中，从OBS将模型导入至ModelArts中，创建为模型，直接用于部署服务。从容器镜像

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
通过OBS创建模型时，构建日志中提示pip下载包失败 - AI开发平台ModelArts

通过OBS创建模型时，构建日志中提示pip下载包失败问题现象通过OBS创建模型构建失败，查看构建日志，提示pip下载包失败。如下载numpy 1.16版本失败。原因分析一般下载包失败时，可能有如下几个原因： pip源中不存在该包，当前默认pip源为pypi.org中的包，请在pypi

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
训练的数据集预处理说明 - AI开发平台ModelArts

--log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。微调数据集预处理参数说明微调包含SFT和LoRA微调。数据集预处理脚本参数说明如下： --input：原始数据集的存放路径。 --ou

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明
Notebook中构建新镜像 - AI开发平台ModelArts

mox #obs存放数据路径 obs_code_dir= "obs://<bucket_name>/llm_train" obs_data_dir= "obs://<bucket_name>/training_data" obs_model_dir= "obs://<bucket_name>/model"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
执行训练任务（历史版本） - AI开发平台ModelArts

输出路径中的数据则会下载至OBS中。 Step3 配置环境变量单击“增加环境变量”，在增加的环境变量填写框中，按照表1表格中的配置进行填写。图2 环境变量表1 需要填写的环境变量环境变量示例值参数说明 MOUNT OBS 表示代码根据OBS存储方式运行。 MODEL_NAME

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
查看日志和性能 - AI开发平台ModelArts

size（GBS）、seq_len（SEQ_LEN）为训练时设置的参数。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。图2 查看日志和性能父主题：主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）

总条数： 1937

上一页
1
...
14
15
16
...
97
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建ModelArts数据选择任务 - AI开发平台ModelArts

ECS获取和上传基础镜像 - AI开发平台ModelArts

创建ModelArts数据校验任务 - AI开发平台ModelArts

创建ModelArts数据清洗任务 - AI开发平台ModelArts

创建ModelArts数据增强任务 - AI开发平台ModelArts

在Workflow中更新已部署的服务 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

构建Workflow多分支运行场景 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

使用MoXing复制数据报错 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

创建模型不同方式的场景介绍 - AI开发平台ModelArts

通过OBS创建模型时，构建日志中提示pip下载包失败 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

Notebook中构建新镜像 - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线