搜索_华为云

训练中的权重转换说明 - AI开发平台ModelArts

json等tokenizer文件或者其他json文件。若缺少则需要直接复制至权重转换后的文件夹中，否则不能直接用于推理。用户自定义执行权重转换参数修改说明同样以 llama2 为例，用户可直接编辑 scripts/llama2/2_convert_mg_hf.sh 脚本，自定义环境变量的值，并运行该脚本。其中环境变量详细介绍如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明
训练作业失败，返回错误码139 - AI开发平台ModelArts

用户代码问题，出现了内存越界、非法访问内存空间的情况。未知系统问题导致，建议先尝试重建作业，重建后仍然失败，建议提工单定位。处理方法如果存在之前能跑通，什么都没修改，过了一阵跑不通的情况，先去排查跑通和跑不通的日志是否存在pip源更新了依赖包，如下图，安装之前跑通的老版本即可。图1 PIP安装对比图

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
训练中的权重转换说明 - AI开发平台ModelArts

json等tokenizer文件或者其他json文件。若缺少则需要直接复制至权重转换后的文件夹中，否则不能直接用于推理。用户自定义执行权重转换参数修改说明同样以 llama2 为例，用户可直接编辑 scripts/llama2/2_convert_mg_hf.sh 脚本，自定义环境变量的值，并运行该脚本。其中环境变量详细介绍如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练中的权重转换说明 - AI开发平台ModelArts

json等tokenizer文件或者其他json文件。若缺少则需要直接复制至权重转换后的文件夹中，否则不能直接用于推理。用户自定义执行权重转换参数修改说明同样以 llama2 为例，用户可直接编辑 scripts/llama2/2_convert_mg_hf.sh 脚本，自定义环境变量的值，并运行该脚本。其中环境变量详细介绍如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明
查看批量服务的事件 - AI开发平台ModelArts

abnormal, deployment is not exist. 请修改实例后重试。正常实例在当前边缘节点状态为xxx，相关信息：xxx Instance is %s in node(%s), %s - 正常当前边缘服务状态为xxx Service status is %s. - 异常

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
查看在线服务的事件 - AI开发平台ModelArts

abnormal, deployment is not exist. 请修改实例后重试。正常实例在当前边缘节点状态为xxx，相关信息：xxx Instance is %s in node(%s), %s - 正常当前边缘服务状态为xxx Service status is %s. - 异常

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

|---annotations |---train2017 |---val2017 更多obsutil的操作，可参考obsutil简介。将文件设置归属为ma-user： chown -R ma-user:ma-group coco 代码云上适配下载YOLOX代码。代码仓地址：https://github

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
创建ModelArts数据增强任务 - AI开发平台ModelArts

据校验。默认值为True。 LightContrast 亮度对比度增强，使用一定的非线性函数改变亮度空间的亮度值。 func：默认值为gamma gamma为常见方法伽马矫正，公式为255*((v/255)**gamma)') sigmoid为函数为S型曲线，公式为255*1/(

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

用户选择了1/2/4卡这些规格的作业，然后设置了CUDA_VISIBLE_DEVICES=‘1’这种类似固定的卡ID号，与实际选择的卡ID不匹配。处理方法尽量代码里不要去修改CUDA_VISIBLE_DEVICES变量，用系统默认里面自带的。如果必须指定卡ID，需要注意1/2/4规格下，指定的卡ID与实际分配的卡ID不匹配的情况。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

模型包文件model.zip中需要用户自己准备模型文件，此处仅是举例示意说明，以一个手写数字识别模型为例。 Model目录下必须要包含推理脚本文件customize_service.py，目的是为开发者提供模型预处理和后处理的逻辑。图5 推理模型model目录示意图（需要用户自己准备模型文件）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
Wav2Lip推理基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下存放着代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。容器不能挂载到/home/ma-user目录，此目录为ma-user用户家目录。如果容器挂载到/h

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

列出相关的静态文件路径，删除并且卸载镜像中的Jupyterlab服务；用户自己业务占用了开发环境官方的8888、8889端口的，需要用户修改自己的进程端口号；用户的镜像指定了PYTHONPATH、sys.path导致服务启动调用冲突的，需在实例启动后，再指定PYTHONPATH、sys

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
IEF节点边缘服务部署失败 - AI开发平台ModelArts

是，重新“启动”边缘服务，如果还是“异常”则联系技术支持处理。否，执行下一步，给用户添加委托权限。添加委托权限。如果是IAM子账号，没有修改委托权限，请联系管理员添加Tenant Administrator委托权限。登录统一身份认证服务IAM管理控制台。单击导航栏的“委托”，进入委托页面。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
使用ModelArts Studio的DeepSeek-R1模型框架实现对话问答 - AI开发平台ModelArts

选择指定的IAM子用户，给指定的IAM子用户配置委托授权。委托选择选择“新增委托”。委托名称 ModelArts会自动生成委托名称，您也可以按实际情况进行修改。权限配置选择“普通模式”，在服务列表右侧勾选“全选”。步骤二：领取免费额度并体验DeepSeek-R1模型在ModelArts

帮助中心 > AI开发平台ModelArts > 快速入门
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

zip上传到${workdir}目录下并解压缩，如：/home/ma-user/ws目录下，以下都以/home/ma-user/ws为例，请根据实际修改。 unzip AscendCloud-*.zip 上传tokenizers文件到工作目录中的/home/ma-user/ws/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906） > 准备工作
镜像方案说明 - AI开发平台ModelArts

Dockerfile会下载Megatron-LM、MindSpeed、ModelLink源码，并将以上源码打包至镜像环境中。如果用户希望修改源码，则需要使用新镜像创建容器，在容器内的/home/ma-user工作目录中访问并编辑以上源码文件。编辑完成后重新构建新镜像。训练作业

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像
镜像方案说明 - AI开发平台ModelArts

Dockerfile会下载Megatron-LM、MindSpeed、ModelLink源码，并将以上源码打包至镜像环境中。如果用户希望修改源码，则需要使用新镜像创建容器，在容器内的/home/ma-user工作目录中访问并编辑以上源码文件。编辑完成后重新构建新镜像。训练作业

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像
精度调优前准备工作 - AI开发平台ModelArts

设置对应的参数。模型结构配置模型结构的超参主要有num-layer、hidden-size、seq-length等。 FA配置超参数为use-flash-attn，决定训练过程中的Attention模块是否使用融合flash attention算子（性能较优）或者使用小算子。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
ModelArts权限管理基本概念 - AI开发平台ModelArts

的权限，才能确保用户可以顺利完成某些ModelArts操作。举例，如果用户需要用OBS中的数据进行训练，当已经为IAM用户配置ModelArts训练权限时，仍需同时为其配置对应的OBS权限（读、写、列表），才可以正常使用。其中OBS的列表权限用于支持用户从ModelArts界面

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理
镜像方案说明 - AI开发平台ModelArts

Dockerfile会下载Megatron-LM、MindSpeed、ModelLink源码，并将以上源码打包至镜像环境中。如果用户希望修改源码，则需要使用新镜像创建容器，在容器内的/home/ma-user工作目录中访问并编辑以上源码文件。编辑完成后重新构建新镜像。训练作业

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像

总条数： 1087

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练中的权重转换说明 - AI开发平台ModelArts

训练作业失败，返回错误码139 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

查看批量服务的事件 - AI开发平台ModelArts

查看在线服务的事件 - AI开发平台ModelArts

上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

创建ModelArts数据增强任务 - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

Wav2Lip推理基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

IEF节点边缘服务部署失败 - AI开发平台ModelArts

使用ModelArts Studio的DeepSeek-R1模型框架实现对话问答 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

精度调优前准备工作 - AI开发平台ModelArts

ModelArts权限管理基本概念 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线