搜索_华为云

日志提示“root: XXX valid number is 0” - AI开发平台ModelArts

root: Eval valid number is 0. INFO: root: Predict valid number is 0. 原因分析该日志表示数据集中的有效样本量为0，可能有如下原因：数据未标注。标注的数据是不符合规格的（如目标检测算法要求标注为矩形框，但是提供数据标注为非矩形框）。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

时序预测-time_series_v2算法部署在线服务预测报错问题现象在线服务预测报错：ERROR: data is shorter than windows。原因分析该报错说明预测使用的数据行数小于window超参值。在使用订阅算法时序预测-time_series_v2训练时，超参：window设置

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
专属资源池关联SFS Turbo显示异常 - AI开发平台ModelArts

Turbo后状态仍显示已关联且无报错信息，而解除关联按钮置灰不可操作。同时该网络的解除关联SFS Turbo按钮置灰不可操作。图3 关联SFS Turbo状态原因分析 ModelArts缺少SFS Turbo委托权限导致关联或解除关联失败。处理方法需要您给ModelArts配置SFS Turbo委托

 帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
日志提示“ValueError: Invalid endpoint: obs.xxxx.com” - AI开发平台ModelArts

训练作业中使用Tensorboard直接写入到OBS路径，在日志中出现报错信息“ValueError: Invalid endpoint: obs. xxxx.com”。原因分析出现该问题的可能原因：直接在OBS上写tensorboard文件，存在不稳定的风险。处理方法建议先将Tensorboard文件写到本地，然后再复制回OBS。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
订阅算法物体检测YOLOv3 - AI开发平台ModelArts

使用订阅算法物体检测YOLOv3_ResNet18(Ascend) 进行训练作业，训练失败报错label_map.pbtxt cannot be found。原因分析该报错信息表示验证集中有label在训练集中不存在，可能由于在发布数据集版本进行数据切分时，训练集比例填写为0导致发布的数据全部为验证集，所以出现上述报错。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
创建Qwen2-0.5B或Qwen2-1.5B模型的LoRA微调类型的调优任务，显示创建失败 - AI开发平台ModelArts

关键日志报错： AttributeError: 'Parameter' object has no attribute 'main_grad' 原因分析 Qwen2-0.5B或Qwen2-1.5B模型不支持也不建议PP切分。问题影响训练无法进行。处理方法对于Qwen2-0.5B或Qwen2-1

帮助中心 > AI开发平台ModelArts > 常见问题 > Studio
精度调优前准备工作 - AI开发平台ModelArts

些三方库的版本一致。环境版本更新这一项仅在条件允许的情况下进行，根据精度问题定位经验，部分问题是由于使用了较早版本的昇腾软件版本或者非商用发布的昇腾软件版本，所以推荐在条件允许的前提下配套安装最新商发版本的昇腾开发套件CANN Toolkit、昇腾驱动以及torch_npu包

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
Notebook运行代码报错，在'/tmp'中到不到文件 - AI开发平台ModelArts

'/var/tmp', '/usr/tmp', 'home/ma-user/work/SR/RDN_train_base'] 图1 运行代码报错原因分析根据报错提示，需要排查是否将大量数据被保存在“/tmp”中。处理方法进入到“Terminal”界面。在“/tmp”目录下，执行命令du

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
出现ModelArts.6333错误，如何处理？ - AI开发平台ModelArts

出现ModelArts.6333错误，如何处理？问题现象在使用Notebook过程中，界面出现“ModelArts.6333”报错信息。原因分析可能由于实例过负载引起故障，Notebook正在自动恢复中，请刷新页面并等待几分钟。常见原因是内存占用满。处理方法当出现此错误时，N

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
订阅的模型一直处于等待同步状态 - AI开发平台ModelArts

订阅的模型一直处于等待同步状态问题现象订阅的模型一直处于等待同步状态。原因分析订阅的模型一直处于等待同步状态，可能原因如下：由于ModelArts的数据存储、模型导入以及部署上线等功能依赖OBS、SWR等服务，需获取依赖服务的授权后，才能正常使用ModelArts的相关功能。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

You can view the instance keypair information on ModelArts console.” 原因分析可能是密钥文件或放置密钥的文件夹权限问题，密钥不正确等，请按以下步骤排查。解决方案排查/home/ma-user权限，建议将该目录权

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

更多Screen使用说明可参考Screen User's Manual。通过py-spy工具分析卡死进程的调用栈并结合代码分析定位卡死问题本文指导用户通过py-spy工具分析卡死进程的调用栈并结合代码分析定位卡死问题。在ModelArts Standard控制台，选择“模型训练>训练作业”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
Pytorch Mox日志反复输出 - AI开发平台ModelArts

INFO:root:Using MoXing-v1.13.0-de803ac9 INFO:root:Using OBS-Python-SDK-3.1.2 原因分析 Pytorch通过spawn模式创建了多个进程，每个进程会调用多进程方式使用Mox下载数据。此时子进程会不断销毁重建，Mox也就会不断的被导入，导致打印很多Mox的版本信息。

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
MXNet创建kvstore时程序被阻塞，无报错 - AI开发平台ModelArts

print('start') kv_store = mxnet.kv.create('dist_async') print('end') 原因分析 worker阻塞的原因可能是连不上server。处理方法将如下代码放在“启动文件”里“import mxnet”之前可以看到节点间相互通信状态，同时ps能够重新发送。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

ED. This error may appear if you passed in a non-contiguous input. 原因分析出现该问题的可能原因如下：数据输入不连续，cuDNN不支持的类型。处理方法禁用cuDNN，在训练前加入如下代码。 torch.backends

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
使用自定义镜像创建的训练作业一直处于运行中 - AI开发平台ModelArts

使用自定义镜像创建的训练作业一直处于运行中问题现象使用自定义镜像创建训练作业，训练作业的“状态”一直处于“运行中”。原因分析及处理办法日志打印如下内容，表示自定义镜像的CPU架构与资源池节点的CPU架构不一致。 standard_init_linux.go:215: exec

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
Notebook中已安装对应库，仍报错import numba ModuleNotFoundError: No module named 'numba' - AI开发平台ModelArts

install numba命令安装了numba库且运行正常（且已保存为自定义镜像），然后使用DataArts执行此脚本的任务时提示没有这个库。原因分析客户创建了多个虚拟环境，numba库安装在了python-3.7.10中，如图1所示。图1 查询创建的虚拟环境解决方案在Terminal中执行conda

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
创建训练作业界面无云存储名称和挂载路径排查思路 - AI开发平台ModelArts

创建训练作业界面无云存储名称和挂载路径排查思路问题现象创建训练作业界面没有云存储名称和挂载路径这两个选项。原因分析用户的专属资源池没有进行网络打通，或者用户没有创建过SFS。处理方法在专属资源池列表中，单击资源池“ID/名称”，进入详情页。单击右上角“配置NAS VPC”，检查是否开启了NAS

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 专属资源池创建训练作业
日志报错“DataFrame.dtypes for data must be int, float or bool” - AI开发平台ModelArts

问题现象训练过程中出现如下报错： DataFrame.dtypes for data must be int, float or bool 原因分析出现该问题的可能原因如下：训练数据中出现了非int、float、bool类型数据。处理方法可参考如下代码，将错误列进行转换： from

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
使用ChatGLM3-6B或GLM-4-9B模型微调后，权重校验失败 - AI开发平台ModelArts

config.json, or their values are inconsistent with standard open source 原因分析 ChatGLM3-6B或GLM-4-9B调优转换后的模型文件中配置文件与原始文件有差异，导致权重校验失败。问题影响 ChatGLM3-

帮助中心 > AI开发平台ModelArts > 常见问题 > Studio

总条数： 1142

上一页
1
...
46
47
48
...
58
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

日志提示“root: XXX valid number is 0” - AI开发平台ModelArts

时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

专属资源池关联SFS Turbo显示异常 - AI开发平台ModelArts

日志提示“ValueError: Invalid endpoint: obs.xxxx.com” - AI开发平台ModelArts

订阅算法物体检测YOLOv3 - AI开发平台ModelArts

创建Qwen2-0.5B或Qwen2-1.5B模型的LoRA微调类型的调优任务，显示创建失败 - AI开发平台ModelArts

精度调优前准备工作 - AI开发平台ModelArts

Notebook运行代码报错，在'/tmp'中到不到文件 - AI开发平台ModelArts

出现ModelArts.6333错误，如何处理？ - AI开发平台ModelArts

订阅的模型一直处于等待同步状态 - AI开发平台ModelArts

报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

Pytorch Mox日志反复输出 - AI开发平台ModelArts

MXNet创建kvstore时程序被阻塞，无报错 - AI开发平台ModelArts

日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

使用自定义镜像创建的训练作业一直处于运行中 - AI开发平台ModelArts

Notebook中已安装对应库，仍报错import numba ModuleNotFoundError: No module named 'numba' - AI开发平台ModelArts

创建训练作业界面无云存储名称和挂载路径排查思路 - AI开发平台ModelArts

日志报错“DataFrame.dtypes for data must be int, float or bool” - AI开发平台ModelArts

使用ChatGLM3-6B或GLM-4-9B模型微调后，权重校验失败 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线