搜索_华为云

日志提示“Please upgrade numpy to >= xxx to use this pandas version” - AI开发平台ModelArts

1.14.5.Please upgrade numpy to >= 1.15.4 to use this pandas version 原因分析出现该问题的可能原因如下： conda和pip包混装，有一些包卸载不掉。处理方法参考如下代码，三步走。先卸载numpy中可以卸载的组件。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志 - AI开发平台ModelArts

现自己的推理逻辑，出现故障后希望通过故障日志排查定位故障原因，但是通过logger打印日志无法在“在线服务”的日志中查看到部分内容。原因分析推理服务的日志如果需要显示出来，需要代码中将日志打印到Console控制台。当前推理基础镜像使用的python的logging模块，采用

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
自动学习为什么训练失败？ - AI开发平台ModelArts

图像识别训练失败请检查是否存在损坏图片，如有请进行替换或删除。物体检测训练失败请检查数据集标注的方式是否正确，目前自动学习仅支持矩形标注。预测分析训练失败请检查标签列的选取。标签列目前支持离散和连续型数据，只能选择一列。声音分类训练失败请检查音频格式是否为16bit的WAV格式。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
自定义镜像导入配置运行时依赖无效 - AI开发平台ModelArts

自定义镜像导入配置运行时依赖无效问题现象通过API接口选择自定义镜像导入创建模型，配置了运行时依赖，没有正常安装pip依赖包。原因分析自定义镜像导入不支持配置运行时依赖，系统不会自动安装所需要的pip依赖包。处理方法重新构建镜像。在构建镜像的dockerfile文件

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
TensorFlow-1.8作业连接OBS时反复出现提示错误 - AI开发平台ModelArts

如下日志信息： Connection has been released. Continuing. Found secret key 原因分析这是TensorFlow-1.8中会出现的情况，该日志是Info级别的，并不是错误信息，可以通过设置环境变量来屏蔽INFO级别的日志信息。环境变量的设置一定要在import

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
训练作业的日志出现detect failed（昇腾预检失败） - AI开发平台ModelArts

Command=bootstrap/run Component=ma-training-toolkit Platform=ModelArts-Service 原因分析出现该问题的可能原因如下：用户的自定义镜像中无ascend_check工具，导致启动预检失败。用户的自定义镜像中的ascend相关工具不可用，导致预检失败。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > Ascend相关问题
训练作业日志中提示 “AttributeError: module '***' has no attribute '***'” - AI开发平台ModelArts

'***'错误。如：AttributeError: module 'torch' has no attribute 'concat'。原因分析出现该问题的可能原因如下：对应python包使用错误，该python包确实没有对应的变量或者方法第三方pip源中的python包版本

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
用户结束kernelgateway进程后报错Server Connection Error，如何恢复？ - AI开发平台ModelArts

当kernelgateway进程被结束后，出现如下报错，以及选不到Kernel。图1 报错Server Connection Error截图图2 选不到Kernel 原因分析用户误操作引起的。解决方案打开Terminal窗口，执行以下命令启动kernelgateway服务。 API_TYPE=kernel_gateway

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
通过自定义镜像创建模型失败 - AI开发平台ModelArts

通过自定义镜像创建模型失败问题现象通过用户自定义镜像创建模型失败。原因分析可能原因如下：导入模型使用的镜像地址不合法或实际镜像不存在用户给ModelArts的委托中没有SWR相关操作权限用户为子账号，没有主账号SWR的权限使用的是非自己账号的镜像使用的镜像为公开镜像

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
数据集图片无法显示，如何解决？ - AI开发平台ModelArts

数据集图片无法显示，如何解决？问题现象创建的数据集，在进行标注时无法显示图片，单击单张图片也无法查看。或者数据集中提示图片加载异常。原因分析可能由于用户本地网络原因，无法正常访问OBS导致图片无法正常加载。可能由于没有OBS桶的访问权限导致，请检查数据集输入位置所在的OBS桶，是否具有访问权限。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

decode byte xxx in position xxx’ 2.‘OSError:File isn't open for writing’ 原因分析出现该问题的可能原因如下： moxing对高版本的pandas兼容性不够。处理方法在适配OBS路径后，读取文件模式从‘r’改成‘rb’，然后将mox

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
日志提示“UnboundLocalError: local variable 'epoch'” - AI开发平台ModelArts

ndLocalError: local variable 'epoch' referenced before assignment。原因分析增量训练作业设置的epochs参数有误，该问题是由YOLOv5的增量训练机制引起：若第二次增量训练的epochs数值和第一次常规训练的epochs数值设置一样，则会报错。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
Cann软件与Ascend驱动版本不匹配 - AI开发平台ModelArts

Cann软件与Ascend驱动版本不匹配问题现象训练失败并提示“Cann软件与Ascend驱动版本不匹配”。原因分析当昇腾规格的训练作业在ModelArts训练平台上运行时，会自动对Cann软件与Ascend驱动的版本匹配情况进行检查。如果平台发现版本不匹配，则会立即训练失败，避免后续无意义的运行时长。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > Ascend相关问题
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

部区域的计算规格。选择计算规格不可用的资源会置灰。右侧“配置信息”区域会显示计算规格的详细数据，AI Gallery会基于资产和资源情况分析该任务是否支持设置“商品数量”，用户可以基于业务需要选择任务所需的资源卡数。在“运行时长控制”选择是否指定运行时长。不限时长：不限制作业的运行时长，AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

"ModelArts.3567", "error_msg": "OBS error occurs because Access Denied." 原因分析 ModelArts.3551：数据输入或者输出的obs目录不存在 ModelArts.3567：使用的数据输入或者输出obs目录存在，但是当前账号无权限访问

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
训练作业访问OBS时，日志提示“stat:403 reason:Forbidden” - AI开发平台ModelArts

reason:Forbidden request-id:00000179D5ACCAC445CAA1A71019C9D0 retry:0 原因分析出现该问题的可能原因如下: OBS服务的权限出现问题，导致无法正常读取数据处理方法请检查OBS权限配置，如未解决问题可参考OBS文档

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
服务预测失败 - AI开发平台ModelArts

服务预测失败问题现象在线服务部署完成且服务已经处于“运行中”的状态，向服务发起推理请求，预测失败。原因分析及处理方法服务预测需要经过客户端、外部网络、APIG、Dispatch、模型服务多个环节。每个环节出现都会导致服务预测失败。图1 推理服务流程图出现APIG.XX

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

/c10/cuda/CUDAFunctions.cpp:109.) return torch._C._cuda_getDeviceCount() > 0 False 原因分析 Error 802原因为缺少fabricmanager，可能由于以下原因导致nvidia-fabricmanager.service不工作：

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
使用VS Code连接实例时，发现VS Code端的实例目录和云上目录不匹配 - AI开发平台ModelArts

Code连接实例时，发现VS Code端的实例目录和云上目录不匹配问题现象用户使用VS Code连接实例时，发现VS Code端的实例目录和云上目录不匹配。原因分析实例连接错误，可能是配置文件写的不规范导致连接到别的实例。解决方案检查用户.ssh配置文件（路径一般在“C:\Users\{User}\

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
日志提示“RuntimeError: connect() timed out” - AI开发平台ModelArts

问题现象使用pytorch进行分布式训练时，日志中出现报错“RuntimeError: connect() timed out”。原因分析出现该问题的可能原因如下：如果在此之前是有进行数据复制的，每个节点复制的速度不是同一个时间完成的，然后有的节点没有复制完，其他节点进行torch

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题

总条数： 416

上一页
1
...
15
16
17
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

日志提示“Please upgrade numpy to >= xxx to use this pandas version” - AI开发平台ModelArts

通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志 - AI开发平台ModelArts

自动学习为什么训练失败？ - AI开发平台ModelArts

自定义镜像导入配置运行时依赖无效 - AI开发平台ModelArts

TensorFlow-1.8作业连接OBS时反复出现提示错误 - AI开发平台ModelArts

训练作业的日志出现detect failed（昇腾预检失败） - AI开发平台ModelArts

训练作业日志中提示 “AttributeError: module '' has no attribute ''” - AI开发平台ModelArts

用户结束kernelgateway进程后报错Server Connection Error，如何恢复？ - AI开发平台ModelArts

通过自定义镜像创建模型失败 - AI开发平台ModelArts

数据集图片无法显示，如何解决？ - AI开发平台ModelArts

使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

日志提示“UnboundLocalError: local variable 'epoch'” - AI开发平台ModelArts

Cann软件与Ascend驱动版本不匹配 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

训练作业访问OBS时，日志提示“stat:403 reason:Forbidden” - AI开发平台ModelArts

服务预测失败 - AI开发平台ModelArts

GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

使用VS Code连接实例时，发现VS Code端的实例目录和云上目录不匹配 - AI开发平台ModelArts

日志提示“RuntimeError: connect() timed out” - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线