搜索_华为云

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

/bin/bash 执行下述命令进入容器。 docker exec -ti 上一命令中的自定义容器名称 bash 执行下述命令进入conda环境。 source /home/ma-user/.bashrc cd ~ 查看容器中可以使用的卡信息。 npu-smi info 如果命令报如下错误，则

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
下载代码目录失败 - AI开发平台ModelArts

图1 获取内容失败原因分析在创建训练作业时指定的代码目录不存在导致训练失败。处理方法请您根据报错原因排查创建训练作业时指定的代码目录，即OBS桶的路径是否正确。有两种方法判断是否存在。使用当前账户登录OBS管理控制台，去查找对应的OBS桶、文件夹、文件是否存在。通过接口判

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
在推理生产环境中部署推理服务 - AI开发平台ModelArts

参数解释请参见部署在线服务。图6 部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图7 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”。如果以vllm接口启动服务，设置请求路径：“/ge

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

add-template命令加载镜像构建模板 ma-cli可以使用add-template命令将镜像模板加载到指定文件夹下，默认路径为当前命令所在的路径。比如${current_dir}/.ma/${template_name}/。也可以通过--dest命令指定保存的路径。当保存

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

GPU A系列裸金属服务器RoCE带宽不足如何解决？问题现象 GP Ant8支持RoCE网卡， Ubuntu20.04场景，在进行nccl-tests时，总线带宽理论峰值可达90GB/s，但实际测试下来的结果只有35GB/s。原因分析 “nv_peer_mem”是一个Linu

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

GPU A系列裸金属服务器无法获取显卡如何解决问题现象在A系列裸金属服务器上使用PyTorch一段时间后，出现获取显卡失败的现象，报错如下： > torch.cuda.is_available() /usr/local/lib/python3.8/dist-packages/torch/cuda/__init__

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
MoXing常用操作的样例代码 - AI开发平台ModelArts

返回一个list： ['dir0', 'dir0/file00', 'file1'] 创建文件夹操作创建一个OBS目录（即OBS文件夹）。支持递归创建，即如果“sub_dir_0”文件夹不存在，也会自动被创建，如果已经存在，则不起任何作用。 1 2 import moxing as mox

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
创建Workflow模型注册节点 - AI开发平台ModelArts

创建Workflow模型注册节点功能介绍通过对ModelArts模型管理的能力进行封装，实现将训练后的结果注册到模型管理中，便于后续服务部署、更新等步骤的执行。主要应用场景如下：注册ModelArts训练作业中训练完成的模型。注册自定义镜像中的模型。属性总览您可以使用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML - AI开发平台ModelArts

GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML 问题现象华为云裸金属服务器，NVIDIA驱动卸载后重新安装。（1）已卸载原有版本NVIDIA驱动和CUDA版本，且已安装新版本的NVIDIA驱动和CUDA版本

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
在推理生产环境中部署推理服务 - AI开发平台ModelArts

设置AI应用单击“立即创建”开始AI应用创建，待应用状态显示“正常”即完成AI应用创建。首次创建AI应用预计花费40~60分钟，之后每次构建AI应用花费时间预计5分钟。若权重文件大于60G，创建AI应用会报错，提示模型大于60G，请提工单扩容。 Step3 部署在线服务将Step2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

参数解释请参见部署在线服务。图6 部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图7 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”。如果以vllm接口启动服务，设置请求路径：“/ge

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
用户使用ma-cli制作自定义镜像失败，报错文件不存在（not found） - AI开发平台ModelArts

found 原因分析复制的文件需要放在Dockerfile同级文件夹或者子目录中，不能放在Dockerfile上层目录。图2 Dockerfile复制文件路径错误解决方案查看用户Dockerfile中的COPY命令中的文件的路径。将要复制的文件放到Dockerfile同级目录

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
在推理生产环境中部署推理服务 - AI开发平台ModelArts

参数解释请参见部署在线服务。图6 部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图7 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”。如果以vllm接口启动服务，设置请求路径：“/ge

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

图2 设置AI应用单击“立即创建”开始AI应用创建，待应用状态显示“正常”即完成AI应用创建。若权重文件大于60G，创建AI应用会报错，提示模型大于60G，请提工单扩容。 Step3 部署在线服务将Step2 部署模型中创建的AI应用部署为一个在线服务，用于推理调用。在ModelArts控制台，单击“模型部署

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

上传数据和算法至SFS（首次使用时需要）前提条件 ECS服务器已挂载SFS，请参考ECS服务器挂载SFS Turbo存储。在ECS中已经创建ma-user和ma-group用户，请参考在ECS中创建ma-user和ma-group。已经安装obsutil，请参考下载和安装obsutil。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
创建Workflow训练作业节点 - AI开发平台ModelArts

创建Workflow训练作业节点功能介绍该节点通过对算法、输入、输出的定义，实现ModelArts作业管理的能力。主要用于数据处理、模型训练、模型评估等场景。主要应用场景如下：当需要对图像进行增强，对语音进行除噪等操作时，可以使用该节点进行数据的预处理。对于一些物体检测，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

Turbo中。具体步骤如下：在创建OBS桶创建的桶下创建文件夹用以存放模型，例如在桶standard-llama2-13b中创建文件夹model/llama-2-13b-hf。利用OBS Browser+工具将下载的模型文件上传至创建的文件夹目录下。在ECS服务器中安装obsutil工

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.911） > 准备工作
GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

通过“nvidia-modprobe”命令来加载相应的内核模块，以便让显卡驱动正常工作。通常情况下，在安装NVIDIA驱动时，会自动执行“nvidia-modprobe”命令，将必要的内核模块加载到系统中。但有时候也可能需要手动执行该命令。例如，在更新了NVIDIA驱动后，需要

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
自定义引擎创建模型规范 - AI开发平台ModelArts

步”，跳转至服务列表页，当服务状态变为“运行中”，服务部署成功。单击服务名称，进入服务详情页面，查看服务详情信息，单击“日志”页签，查看服务日志信息。图2 查看服务日志信息服务预测在服务详情页面，单击“预测”页签，进行服务预测。图3 服务预测父主题：创建模型规范参考

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

ToolKit插件创建训练作业并调试。前提条件 Step1 下载并安装PyCharm ToolKit。在本地PyCharm中已有训练代码工程。已在OBS中创建桶和文件夹，用于存放数据集和训练输出模型。例如：创建命名为“test-modelarts2”的桶，创建文件夹“datas

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业

总条数： 2120

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

下载代码目录失败 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

MoXing常用操作的样例代码 - AI开发平台ModelArts

创建Workflow模型注册节点 - AI开发平台ModelArts

GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

用户使用ma-cli制作自定义镜像失败，报错文件不存在（not found） - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

创建Workflow训练作业节点 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线