搜索_华为云

服务预测 - AI开发平台ModelArts
服务预测 - AI开发平台ModelArts

服务预测服务预测失败服务预测失败，报错APIG.XXXX 在线服务预测报错ModelArts.4206 在线服务预测报错ModelArts.4302 在线服务预测报错ModelArts.4503 在线服务预测报错MR.0105 Method Not Allowed 请求超时返回Timeout

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
日志文件的大小达到限制 - AI开发平台ModelArts

日志文件的大小达到限制问题现象 ModelArts训练作业在运行过程中报错，提示日志文件的大小已达到限制： modelarts-pope: log length overflow(max:1073741824; already: 107341771; new:90), process

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
分布式Tensorflow无法使用“tf.variable” - AI开发平台ModelArts

分布式Tensorflow无法使用“tf.variable” 问题现象多机或多卡使用“tf.variable”会造成以下错误： WARNING:tensorflow:Gradient is None for variable:v0/tower_0/UNET_v7/sub_pixel/Variable:0

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
ModelArts的Notebook实例upload后，数据会上传到哪里？ - AI开发平台ModelArts

ModelArts的Notebook实例upload后，数据会上传到哪里？针对这个问题，有两种情况：如果您创建的Notebook使用OBS存储实例时单击“upload”后，数据将直接上传到该Notebook实例对应的OBS路径下，即创建Notebook时指定的OBS路径。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
准备Notebook - AI开发平台ModelArts

准备Notebook ModelArts Notebook云上云下，无缝协同，更多关于ModelArts Notebook的详细资料请查看开发环境介绍。本案例中的训练作业需要通过SFS Turbo挂载盘的形式创建，因此需要将上述数据集、代码、权重文件从OBS桶上传至SFS Turbo中。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
使用预置算法训练时，训练失败，报“bndbox”错误 - AI开发平台ModelArts

使用预置算法训练时，训练失败，报“bndbox”错误问题现象使用预置算法创建训练作业，训练失败，日志中出现如下报错。 KeyError: 'bndbox' 原因分析用于训练的数据集中，使用了“非矩形框”标注。而预置使用算法不支持“非矩形框”标注的数据集。处理方法此问题有两种解决方法：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
训练作业运行失败 - AI开发平台ModelArts

训练作业运行失败训练作业运行失败排查指导训练作业运行失败，出现NCCL报错自定义镜像训练作业失败定位思路使用自定义镜像创建的训练作业一直处于运行中使用自定义镜像创建训练作业找不到启动文件训练作业的监控内存指标持续升高直至作业失败订阅算法物体检测YOLOv3_ResN

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍本小节通过一个具体问题案例，介绍模型精度调优的过程。如下图所示，使用MindSpore Lite生成的图像和onnx模型的输出结果有明显的差异，因此需要对MindSpore Lite pipeline进行精度诊断。图1 结果对比在MindSpore Lite 2.0

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
使用Qwen2.5-72B-1K、Qwen2.5-32B调优的Checkpoint创建模型时，权重校验失败 - AI开发平台ModelArts

使用Qwen2.5-72B-1K、Qwen2.5-32B调优的Checkpoint创建模型时，权重校验失败问题现象使用Qwen2.5-72B-1K、Qwen2.5-32B调优的Checkpoint创建模型时，权重校验失败。版本详情的报错信息如下： Insufficient storage

帮助中心 > AI开发平台ModelArts > 常见问题 > Studio
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍不同AI模型训练所需要的数据量和算力不同，在训练时选择合适的存储及训练方案可提升模型训练效率与资源性价比。ModelArts Standard支持单机单卡、单机多卡和多机多卡的训练场景，满足不同AI模型训练的要求。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
在ModelArts中同一个账户，图片展示角度不同是为什么？ - AI开发平台ModelArts

在ModelArts中同一个账户，图片展示角度不同是为什么？有的图片存在旋转角度等属性，不同的浏览器的处理策略不同，对浏览器的兼容性如表1和表2所示。 L代表last，L3-产品版本上线时最新的3个稳定浏览器版本。如果您当前使用的浏览器版本过低，将在一定程度上影响页面的显示效果，系统会提示您尽快对浏览器进行升级。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
训练作业性能降低 - AI开发平台ModelArts

训练作业性能降低问题现象使用ModelArts平台训练算法训练耗时增加。原因分析可能存在如下原因：平台上的代码经过修改优化、训练参数有过变更。训练的GPU硬件工作出现异常。处理方法请您对作业代码进行排查分析，确认是否对训练代码和参数进行过修改。检查资源分配情况（

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业性能问题
训练作业找不到GPU - AI开发平台ModelArts

训练作业找不到GPU 问题现象训练作业运行出现如下报错： failed call to cuInit: CUDA_ERROR_NO_DEVICE: no CUDA-capable device is detected 原因分析根据错误信息判断，报错原因为训练作业运行程序读取不到GPU。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
Notebook中构建新镜像 - AI开发平台ModelArts

Notebook中构建新镜像 ModelArts中注册镜像通过ECS获取和上传基础镜像将基础镜像上传后，可在SWR中查看已上传的镜像。但在ModelArts中还需要完成镜像注册后，才能在后续的Notebook中使用。镜像注册的操作步骤如下：登录ModelArts管理控制台，在左侧导航栏单击“镜像管理”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
订阅的模型一直处于等待同步状态 - AI开发平台ModelArts

订阅的模型一直处于等待同步状态问题现象订阅的模型一直处于等待同步状态。原因分析订阅的模型一直处于等待同步状态，可能原因如下：由于ModelArts的数据存储、模型导入以及部署上线等功能依赖OBS、SWR等服务，需获取依赖服务的授权后，才能正常使用ModelArts的相关功能。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
快速开始 - AI开发平台ModelArts
快速开始 - AI开发平台ModelArts

快速开始 ModelArts SDK目前仅支持在ModelArts开发环境Notebook和本地PC两种环境使用。 ModelArts SDK不支持在训练作业和在线服务中使用。 ModelArts SDK已经集成在ModelArts开发环境Notebook中，可以直接使用，无需进行Session鉴权。

帮助中心 > AI开发平台ModelArts > SDK参考
迁移效果校验 - AI开发平台ModelArts

迁移效果校验在pipeline适配完成后，需要验证适配后的效果是否满足要求，通过对比原始onnx pipeline的最终输出结果确认迁移效果。如果精度和性能都没有问题，则代表迁移完成。对比图片生成效果在CPU上推理onnx，将原始onnx和适配完成的MindSpore Lite

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
训练作业的自定义镜像制作流程 - AI开发平台ModelArts

训练作业的自定义镜像制作流程如果您已经在本地完成模型开发或训练脚本的开发，且您使用的AI引擎是ModelArts不支持的框架。您可以制作自定义镜像，并上传至SWR服务。您可以在ModelArts使用此自定义镜像创建训练作业，使用ModelArts提供的资源训练模型。制作流程图1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
解析Pascal VOC文件 - AI开发平台ModelArts

解析Pascal VOC文件解析xml文件支持本地和OBS，如果是OBS，需要Session信息。 PascalVoc.parse_xml(xml_file_path, session=None) 示例代码指定xml路径，通过调用parse_xml来解析获取xml文件的信息。

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，VS Code打开后未进行远程连接 - AI开发平台ModelArts

在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，VS Code打开后未进行远程连接如果本地为Linux系统，见原因分析二。原因分析一自动安装VS Code插件ModelArts-HuaweiCloud失败。解决方法一方法一：检查VS Code网络是否正常。在VS

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理

总条数： 2192

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

服务预测 - AI开发平台ModelArts

日志文件的大小达到限制 - AI开发平台ModelArts

分布式Tensorflow无法使用“tf.variable” - AI开发平台ModelArts

ModelArts的Notebook实例upload后，数据会上传到哪里？ - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

使用预置算法训练时，训练失败，报“bndbox”错误 - AI开发平台ModelArts

训练作业运行失败 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

使用Qwen2.5-72B-1K、Qwen2.5-32B调优的Checkpoint创建模型时，权重校验失败 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

在ModelArts中同一个账户，图片展示角度不同是为什么？ - AI开发平台ModelArts

训练作业性能降低 - AI开发平台ModelArts

训练作业找不到GPU - AI开发平台ModelArts

Notebook中构建新镜像 - AI开发平台ModelArts

订阅的模型一直处于等待同步状态 - AI开发平台ModelArts

快速开始 - AI开发平台ModelArts

迁移效果校验 - AI开发平台ModelArts

训练作业的自定义镜像制作流程 - AI开发平台ModelArts

解析Pascal VOC文件 - AI开发平台ModelArts

在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，VS Code打开后未进行远程连接 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线