搜索_华为云

如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

execution on the device 原因分析因为编译的时候需要设置setup.py中编译的参数arch和code和电脑的显卡匹配。解决方法对于GP Vnt1的显卡，GPU算力为-gencode arch=compute_70,code=[sm_70,compute_70]，设置setup

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 代码运行常见错误
使用PyCharm ToolKit ，提示Error occurs when accessing to OBS - AI开发平台ModelArts

ToolKit的日志，报错信息为：Error occurs when accessing to OBS。原因分析可能是用户无OBS权限。解决方法判断用户是否有OBS权限。登录ModelArts控制台，进入“数据管理 > 数据集 ”，单击“创建数据集”，如果可以成功访问对应的OB

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > PyCharm Toolkit使用
如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

execution on the device 原因分析因为编译的时候需要设置setup.py中编译的参数arch和code和电脑的显卡匹配。解决方法对于GP Vnt1的显卡，GPU算力为-gencode arch=compute_70,code=[sm_70,compute_70]，设置setup

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
使用Windows下生成的文本文件时报错找不到路径？ - AI开发平台ModelArts

原因分析 Notebook是Linux环境，和Windows环境下的换行格式不同，Windows下是CRLF，而Linux下是LF。解决方法可以在Notebook中转换文件格式为Linux格式。 shell语言： dos2unix 文件名父主题：代码运行故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
运行训练作业时提示URL连接超时 - AI开发平台ModelArts

error [Errno 110] Connection timed out> 原因分析由于安全性问题在ModelArts上不能联网下载。处理方法如果在运行训练作业时提示连接超时，请您将需要联网下载的数据提前下载至本地，并上传至OBS中。父主题：外网访问限制

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 外网访问限制
报错“The VS Code Server failed to start”如何解决？ - AI开发平台ModelArts

报错“The VS Code Server failed to start”如何解决？问题现象解决方法检查VS Code版本是否为1.78.2或更高版本，如果是，请查看Remote-SSH版本，如果Remote-SSH版本低于v0.76.1，请升级Remote-SSH。打开命令面板（Windows：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
在Notebook中使用tensorboard命令打开日志文件报错Permission denied - AI开发平台ModelArts

--logdir ./命令，报错[Errno 13] Permission denied……。原因分析当前目录下包含没有权限的文件。解决方法建议用户新建一个文件夹（例如：tb_logs），将tensorboard的日志文件（例如：tb.events）放到新建的文件夹下，然后执

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
删除数据集 - AI开发平台ModelArts

dataset_id="68ZXdK6CZwgvUICOOdC") 参数说明表1 请求参数参数是否必选参数类型描述 session 是 Object 会话对象，初始化方法请参见Session鉴权。 dataset_id 是 String 数据集的ID。父主题：数据集管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

connect to endpoint 原因分析 OBS连接不稳定可能会出现报错，“Unable to connect to endpoint”。处理方法对于OBS连接不稳定的现象，通过增加代码来解决。您可以在代码最前面增加如下代码，让TensorFlow对ckpt和summary的读取和写入可以通过本地缓存的方式中转解决：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
镜像保存时报错“BuildImage,True,Commit successfully|PushImage,False,Task is running.” - AI开发平台ModelArts

successfully|PushImage,False,Task is running. 可能原因镜像过大Push任务一直在运行，或实例节点有问题。解决方法以对应租户的华为云账号登录SWR服务，查看镜像是否已经Push成功。如果Push成功，请重新注册镜像。如果未Push成功，联系SRE查看对应实例的节点是否有问题。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
训练运行报错AttributeError: 'torch_npu._C._NPUDeviceProperties' object has no attribute 'multi_processor_count' - AI开发平台ModelArts

'multi_processor_count'”。图1 报错信息原因分析这是因为torch_npu当前不支持DataParallel（DP）并行模式。处理方法如果是运行单卡模式，在训练脚本中加入export ASCEND_RT_VISIBLE_DEVICES=0（指定 0 号卡对当前进程可见）。多卡环境模式需要运行DDP并行模式。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导 > 常见问题
资源池推理服务一直初始化中如何解决 - AI开发平台ModelArts

专属池网段和推理微服务dispatcher网段冲突，导致专属池上的VPCEP终端节点无法创建，该region无法使用此网段创建包含推理服务的资源池。处理方法选择其他网段的ModelArts网络重建资源池即可解决网段冲突问题。父主题：资源池

 帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
如何解决“在IOS系统里打开ModelArts的Notebook，字体显示异常”的问题？ - AI开发平台ModelArts

如何解决“在IOS系统里打开ModelArts的Notebook，字体显示异常”的问题？问题现象在IOS系统里打开ModelArts的Notebook时，字体显示异常。解决方法设置Terminal的“fontFamily”为“Menlo”。操作步骤登录ModelArts管理控制台，选择“开发空间>Notebook”。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 环境配置相关
在Notebook中使用tensorboard命令打开日志文件报错Permission denied - AI开发平台ModelArts

--logdir ./命令，报错[Errno 13] Permission denied……。原因分析当前目录下包含没有权限的文件。解决方法建议用户新建一个文件夹（例如：tb_logs），将tensorboard的日志文件（例如：tb.events）放到新建的文件夹下，然后执

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 其他故障
日志提示“ValueError: label - AI开发平台ModelArts

3:'banana'} 原因分析训练集中的标签个数与验证集中的个数不一致，导致该错误发生。例如，训练集中的标签共有4个，验证集中的标签只有3个。处理方法请您保持数据中训练集和验证集的标签数量一致。父主题：预置算法运行故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
如何上传数据至OBS？ - AI开发平台ModelArts

OBS桶与ModelArts的所处区域，请参见查看OBS桶与ModelArts是否在同一区域。建议根据业务情况及使用习惯，选择OBS使用方法。如果您的数据量较小（小于100MB）或数据文件少（少于100个），建议您使用控制台上传数据。控制台上传无需工具下载或多余配置，在少量数据上传时，更加便捷高效。

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

Lite Server GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？如何将Ubuntu20.04内核版本从低版本升级至5.4.0-144-generic？如何禁止Ubuntu 20.04内核自动升级？

帮助中心 > AI开发平台ModelArts > 常见问题
模型使用CV2包部署在线服务报错 - AI开发平台ModelArts

使用OBS导入元模型，会用到服务侧的标准镜像，标准镜像里面没有CV2依赖的so的内容。所以ModelArts不支持从对象存储服务（OBS）导入CV2模型包。处理方法需要您把CV2包制作为自定义镜像，上传至容器镜像服务（SWR），选择从容器镜像中导入元模型，部署在线服务。如何制作自定义镜像请参考从0-1制作自定义镜像并创建AI应用。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
服务状态一直处于“部署中” - AI开发平台ModelArts

服务状态一直处于“部署中”，查看模型日志未发现服务有明显错误。原因分析一般情况都是模型的端口配置有问题。建议您首先检查创建模型的端口是否正确。处理方法模型的端口没有配置，如您在自定义镜像配置文件中修改了端口号，需要在部署模型时，配置对应的端口号，使新的模型重新部署服务。如何修改默认端

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
服务部署失败，报错No Module named XXX - AI开发平台ModelArts

服务部署失败，报错：No Module named XXX 原因分析 No Module named XXX，表示模型中没有导入对应依赖模块。处理方法依赖模块没有导入，需要您在模型推理代码中导入缺失依赖模块。例如您的模型是Pytorch框架，部署为在线服务时出现告警：ModuleNotFoundError:

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署

总条数： 1184

上一页
1
...
31
32
33
...
60
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

使用PyCharm ToolKit ，提示Error occurs when accessing to OBS - AI开发平台ModelArts

如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

使用Windows下生成的文本文件时报错找不到路径？ - AI开发平台ModelArts

运行训练作业时提示URL连接超时 - AI开发平台ModelArts

报错“The VS Code Server failed to start”如何解决？ - AI开发平台ModelArts

在Notebook中使用tensorboard命令打开日志文件报错Permission denied - AI开发平台ModelArts

删除数据集 - AI开发平台ModelArts

保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

镜像保存时报错“BuildImage,True,Commit successfully|PushImage,False,Task is running.” - AI开发平台ModelArts

训练运行报错AttributeError: 'torch_npu._C._NPUDeviceProperties' object has no attribute 'multi_processor_count' - AI开发平台ModelArts

资源池推理服务一直初始化中如何解决 - AI开发平台ModelArts

如何解决“在IOS系统里打开ModelArts的Notebook，字体显示异常”的问题？ - AI开发平台ModelArts

在Notebook中使用tensorboard命令打开日志文件报错Permission denied - AI开发平台ModelArts

日志提示“ValueError: label - AI开发平台ModelArts

如何上传数据至OBS？ - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

模型使用CV2包部署在线服务报错 - AI开发平台ModelArts

服务状态一直处于“部署中” - AI开发平台ModelArts

服务部署失败，报错No Module named XXX - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线