搜索_华为云

模型推理代码编写说明 - AI开发平台ModelArts

model目录下放置label.json文件，此处读取 dir_path = os.path.dirname(os.path.realpath(self.model_path)) with open(os.path.join(dir_path, 'label.json')) as f:

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

码。 import pandas as pd import moxing as mox mox.file.shift('os', 'mox') # 将os的open操作替换未mox.file.File适配OBS路径的操作 param = {'encoding': 'utf-8'}

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
自定义脚本代码示例 - AI开发平台ModelArts

not os.path.exists(work_directory): os.mkdir(work_directory) filepath = os.path.join(work_directory, filename) if not os.path

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
训练作业使用MoXing拷贝数据较慢，重复打印日志 - AI开发平台ModelArts

上，这样会导致下载数据很慢。在训练作业中，使用如下代码进行“.tar”包解压： import moxing as mox import os mox.file.copy_parallel("obs://donotdel-modelarts-test/AI/data/PyTorch-1

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
日志提示"write line error" - AI开发平台ModelArts

处理方法如果在训练作业的工作目录下有core文件生成，可以在启动脚本最前面加上如下代码，来关闭core文件产生。 import os os.system("ulimit -c 0") 排查数据集大小，checkpoint保存文件大小，是否占满了磁盘空间。必现的问题，使用本

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

3 打印如下信息，表示上传镜像成功。图5 成功上传镜像 Step8 注册镜像镜像上传至SWR成功后，在ModelArts控制台的“镜像管理”页面中单击“注册镜像”。图6 在ModelArts控制台注册镜像在镜像源中，选择上一步中上传到SWR自有镜像仓中的镜像名，作为模型推

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 准备工作
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

3 打印如下信息，表示上传镜像成功。图5 成功上传镜像 Step8 注册镜像镜像上传至SWR成功后，在ModelArts控制台的“镜像管理”页面中单击“注册镜像”。图6 在ModelArts控制台注册镜像在镜像源中，选择上一步中上传到SWR自有镜像仓中的镜像名，作为模型推

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 准备工作
标注图像分类数据 - AI开发平台ModelArts

完成修改。图5 编辑标签删除标签：在“选中文件标签”区域中，单击操作列的删除该标签。基于标签修改在数据标注概览页，单击右侧的“标签管理”，即可显示全部标签的信息。图6 全部标签的信息修改标签：在需要修改的标签的“操作”列，单击“修改”，输入修改后的标签，单击“确定”即可。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
创建Workflow数据集标注节点 - AI开发平台ModelArts

用户只创建了一个未标注完成的数据集，需要在工作流运行时对数据进行人工标注。可以放在数据集导入节点之后，对导入的新数据进行人工标注。数据准备：提前在ModelArts管理控制台创建一个数据集。 from modelarts import workflow as wf # 通过LabelingStep给输入的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
部署推理服务 - AI开发平台ModelArts

nci7。 -v ${dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的大文件系统，dir为宿主机中文件目录，${container_work_dir}为要挂载到的容器中的目录。为方便两个地址可以相同。容器不能挂载到/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
VS Code一键连接Notebook - AI开发平台ModelArts

Windows：C:\Users\{{user}} Mac/Linux: Users/{{user}} VS Code连接Notebook 登录ModelArts管理控制台，在左侧导航栏中选择“开发空间 > Notebook”，进入“Notebook”页面。该界面显示已创建实例的状态为“运行中”。当前有两种方式，可以打开VS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
读取文件报错，如何正确读取文件 - AI开发平台ModelArts

read(img_path), np.uint8), 1) 在MXNet环境下使用torch包，请您尝试如下方法先进行导包： import os os.sysytem('pip install torch') import torch 父主题： OBS操作相关故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

', type=str, default=os.path.join(file_dir, 'input_dir')) parser.add_argument('--output_dir', type=str, default=os.path.join(file_dir, 'output_dir'))

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
日志提示“No module name 'unidecode'” - AI开发平台ModelArts

处理方法将requirements.txt中的Unidecode改为unidecode。建议与总结您可以在训练代码里添加一行： os.system('pip list') 然后运行训练作业，查看日志中是否有所需要的模块。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
编写训练代码 - AI开发平台ModelArts

如何安装C++的依赖库？训练作业中如何判断文件夹是否复制完毕？如何在训练中加载部分训练好的参数？训练作业的启动文件如何获取训练作业中的参数？训练作业中使用os.system('cd xxx')无法进入相应的文件夹？训练作业如何调用shell脚本，是否可以执行.sh文件？训练代码中，如何获取依赖文件所在的路径？

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业
部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

runtime没有找到。处理方法建议您按以下步骤排查处理：确认部署在线服务时是否选择了GPU规格。在customize_service.py中添加一行代码os.system('nvcc -V)查看该镜像的cuda版本（customize_service.py编写指导请见模型推理代码编写说明）。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

3 打印如下信息，表示上传镜像成功。图6 成功上传镜像 Step8 注册镜像镜像上传至SWR成功后，在ModelArts控制台的“镜像管理”页面中单击“注册镜像”。图7 在ModelArts控制台注册镜像在镜像源中，选择上一步中上传到SWR自有镜像仓中的镜像名，作为模型推

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
训练作业找不到GPU - AI开发平台ModelArts

根据错误信息判断，报错原因为训练作业运行程序读取不到GPU。处理方法根据报错提示，请您排查代码，是否已添加以下配置，设置该程序可见的GPU： os.environ['CUDA_VISIBLE_DEVICES'] = '0,1,2,3,4,5,6,7' 其中，0为服务器的GPU编号，可

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
使用自定义引擎在ModelArts Standard创建AI应用 - AI开发平台ModelArts

1:8080/${推理服务的请求路径} 推理部署示例本节将详细说明以自定义引擎方式创建AI应用的步骤。创建AI应用并查看AI应用详情登录ModelArts管理控制台，进入“AI应用”页面中，单击“创建应用”，进入AI应用创建页面，设置相关参数如下：元模型来源：选择“从对象存储服务（OBS）中选择”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

--tensor-parallel-size：并行卡数。 --gpu-memory-utilization：0~1之间的float，实际使用的显存是系统读取的最大显存*gpu-memory-utilization。 --max-model-len：最大数据输入+输出长度，不能超过模型配置文件config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）

总条数： 1245

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

模型推理代码编写说明 - AI开发平台ModelArts

使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

自定义脚本代码示例 - AI开发平台ModelArts

训练作业使用MoXing拷贝数据较慢，重复打印日志 - AI开发平台ModelArts

日志提示"write line error" - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

标注图像分类数据 - AI开发平台ModelArts

创建Workflow数据集标注节点 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

VS Code一键连接Notebook - AI开发平台ModelArts

读取文件报错，如何正确读取文件 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

日志提示“No module name 'unidecode'” - AI开发平台ModelArts

编写训练代码 - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

训练作业找不到GPU - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建AI应用 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线