搜索_华为云

查询数据集详情 - AI开发平台ModelArts

String 数据集输出位置，用于存放输出的标注信息等文件。此位置为OBS路径，格式为“/桶名称/文件路径”。例如：“/obs-bucket”。 work_path_type Integer 数据集输出路径类型。默认值为0，表示OBS桶。 workforce_descriptor WorkforceDescriptor

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
指令监督微调训练任务 - AI开发平台ModelArts

必须修改。加载tokenizer与Hugging Face权重时存放目录绝对或相对路径。请根据实际规划修改。 template qwen 必须修改。用于指定模板。如果设置为"qwen"，则使用Qwen模板进行训练，模板选择可参照表1中的template列 output_dir /home/ma-user/w

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
LoRA微调训练 - AI开发平台ModelArts

多机必填，单机忽略；节点序号，当前节点ID，一般从0开始，单机默认是0。以8机训练为例，节点ID依次为（0 1 2 3 4 5 6 7）；一般ID为0的节点设置为主节点IP。 WORK_DIR /home/ma-user/ws 非必填。容器的工作目录。训练的权重文件保存在此路径下。默认值为：/home/ma-user/ws。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
如何将两个数据集合并？ - AI开发平台ModelArts

发布后可获得数据集A和数据集B的Manifest文件。可通过数据集的“数据集输出位置”获得此文件。创建一个空数据集C，即无任何输出，其输入位置选择一个空的OBS文件夹。在数据集C中，执行导入数据操作，将数据集A和数据集B的Manifest文件导入。导入完成后，即将数据集A和数据集B的数据分别都

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
入门案例：快速创建一个物体检测的数据集 - AI开发平台ModelArts

“保存路径”：即导出数据存储的路径。建议不要将数据存储至当前数据集所在的输入路径或输出路径。图12 导出至OBS 数据导出成功后，您可以前往您设置的保存路径，查看到存储的数据。查看任务历史当您导出数据后，可以通过任务历史查看导出任务明细。在数据集详情页面中，单击右上角“任务历史

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导出ModelArts数据集中的数据
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

行模型的性能。 AKG的配置也是在模型转换阶段进行配置（即执行converter_lite命令时），通过指定对应的配置文件akg.cfg，设置对应的akg优化级别，并且在模型转换时参考样例进行对应的配置。 # akg.cfg [graph_kernel_param] opt_level=2

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
预训练任务 - AI开发平台ModelArts

多机必填，单机忽略；节点序号，当前节点ID，一般从0开始，单机默认是0。以8机训练为例，节点ID依次为（0 1 2 3 4 5 6 7）；一般ID为0的节点设置为主节点IP。 WORK_DIR /home/ma-user/ws 非必填。容器的工作目录。训练的权重文件保存在此路径下。默认值为：/home/ma-user/ws。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
释放Lite Server资源 - AI开发平台ModelArts

复制需要退订的实例ID。图4 复制实例ID Server购买订单里绑定的资源ID为Server ID，与Server产品所封装的BMS/ECS ID不同，若要退订Server，需要在ModelArts控制台的“AI专属资源池 > 弹性节点 Server”中查询对应ID。单击顶部“费用”，进入费用中心，单击“订单管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
导入AI应用后部署服务，提示磁盘不足 - AI开发平台ModelArts

处理方法公共资源池容器Docker size的大小最大支持50G，专属资源池Docker size的大小最大支持50G。如果使用的是OBS导入或者训练导入，则包含基础镜像、模型文件、代码、数据文件和下载安装软件包的大小总和。如果使用的是自定义镜像导入，则包含解压后镜像和镜像下载文件的大小总和。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
Notebook使用场景 - AI开发平台ModelArts

用于连接ModelArts服务并在ModelArts资源上执行管理命令。ma-cli支持用户在ModelArts Notebook及线下虚拟机中与云端服务交互，使用ma-cli命令可以实现命令自动补全、鉴权、镜像构建、提交ModelArts训练作业、提交DLI Spark作业、O

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
查询数据集导出任务列表 - AI开发平台ModelArts

on_name String 导出数据集版本的名称。 export_dest String 数据集导出类型。可选值如下： DIR：导出到OBS（默认值） NEW_DATASET：导出到新数据集 export_new_dataset_name String 导出新数据集的名称。 e

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

训练作业中存在2个代码目录，一个是从OBS上传到ModelArts Standard训练容器中的代码目录OBS_CODE_DIR，一个是后续构建新镜像步骤ECS中构建新镜像中镜像的代码目录CODE_DIR。修改代码如图1。图1 修改区分训练作业中2个代码目录使用环境变量SAVE_PATH重新覆

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 准备工作
SFT全参微调任务 - AI开发平台ModelArts

多机必填，单机忽略。节点序号，当前节点ID，一般从0开始，单机默认是0。以8机训练为例，节点ID依次为（0 1 2 3 4 5 6 7）；一般ID为0的节点设置为主节点IP。 WORK_DIR /home/ma-user/ws 非必填。容器的工作目录。训练的权重文件保存在此路径下。默认值为：/home/ma-user/ws。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调训练
执行微调训练任务 - AI开发平台ModelArts

必须修改。加载tokenizer与Hugging Face权重时存放目录绝对或相对路径。请根据实际规划修改。 template qwen 必须修改。用于指定模板。如果设置为"qwen"，则使用Qwen模板进行训练，模板选择可参照表1中的template列 output_dir /home/ma-user/w

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
JupyterLab常用功能介绍 - AI开发平台ModelArts

Git插件相关操作，可以方便快捷的使用Github代码库。 Tabs 同时打开多个ipynb文件时，通过Tabs激活或选择文件。 Settings JupyterLab工具系统设置。 Help JupyterLab工具自带的帮助参考。图15 ipynb文件菜单栏中的快捷键表4 ipynb文件菜单栏中的快捷键快捷键

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
查询训练作业列表 - AI开发平台ModelArts

session 是 Object 会话对象，初始化方法请参考Session鉴权。 offset 否 Integer 查询作业的偏移量，最小为0。例如设置为1，则表示从第二条开始查。 limit 否 Integer 查询作业的限制量。最小为1，最大为50。 sort_by 否 String

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
精度对齐 - AI开发平台ModelArts
精度对齐 - AI开发平台ModelArts

图中蓝色loss_0是NPU迭代曲线，黄色loss_1是GPU的迭代曲线。问题定位解决使用ptdbg_ascend工具dump全网数据，dump接口设置方法具体参考PyTorch精度工具。dump完成后compare GPU和NPU结果进行分析。 dropout算子引入了随机性偏差，如下图：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导
LoRA微调训练 - AI开发平台ModelArts

多机必填。节点序号，当前节点ID，一般从0开始。单机默认是0。以Qwen-72B 5机训练为例，节点ID依次为（0 1 2 3 4）；一般ID为0的节点设置为主节点IP。 MODEL_PATH /home/ma-user/ws/processed_for_ma_input/Qwen-14B/converted_weights

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
训练中途卡死 - AI开发平台ModelArts

Sumarywriter('./path)/to/log') 解决方案3 存储路径设为本地路径，如cache/tensorboard，不要使用OBS路径。问题现象4 使用pytorch中的dataloader读数据时，作业卡在读数据过程中，日志停在训练的过程中并不再更新日志。解决方案4

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业卡死
资源选择推荐 - AI开发平台ModelArts

桶（存放代码）”，采用分布式训练。表1 不同场景所需服务及购买推荐场景 OBS SFS SWR DEW ModelArts VPC ECS EVS 单机单卡按需购买。（并行文件系统） × 免费。免费。包月购买。免费。 × 按需购买。单机多卡 × 包月购买。（HPC型500G）

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练

总条数： 1323

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询数据集详情 - AI开发平台ModelArts

指令监督微调训练任务 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

如何将两个数据集合并？ - AI开发平台ModelArts

入门案例：快速创建一个物体检测的数据集 - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

释放Lite Server资源 - AI开发平台ModelArts

导入AI应用后部署服务，提示磁盘不足 - AI开发平台ModelArts

Notebook使用场景 - AI开发平台ModelArts

查询数据集导出任务列表 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

SFT全参微调任务 - AI开发平台ModelArts

执行微调训练任务 - AI开发平台ModelArts

JupyterLab常用功能介绍 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

精度对齐 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

训练中途卡死 - AI开发平台ModelArts

资源选择推荐 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线