搜索_华为云

复制数据至容器中空间不足 - AI开发平台ModelArts

复制数据至容器中空间不足问题现象 ModelArts训练作业运行时，日志中遇到如下报错，导致数据无法复制至容器中。 OSError:[Errno 28] No space left on device 原因分析数据下载至容器的位置空间不足。处理方法请排查是否将数据下载至“

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
训练作业进程被kill - AI开发平台ModelArts

训练作业进程被kill 问题现象用户进程被Kill表示用户进程因外部因素被Kill或者中断，表现为日志中断。原因分析 CPU软锁在解压大量文件可能会出现此情况并造成节点重启。可以适当在解压大量文件时，加入sleep。比如每解压1w个文件，就停止1s。存储限制根据规格情况

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
用户执行huaweicloud.com相关API超时 - AI开发平台ModelArts

用户执行huaweicloud.com相关API超时问题现象用户在Notebook里通过request请求接口时超时：GET pangu-xxx.cn-southwest-2.myhuaweicloud.com。原因分析在Notebook中访问公网需要通过代理，访问huawei

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
tensorboard显示502 bad gateway - AI开发平台ModelArts

tensorboard显示502 bad gateway 问题现象启动tensorboard后，打开tensorboard提示502 bad gateway，或者偶现502 bad gateway。原因分析出现该问题的可能原因如下: 启动tensorboard对应的summ

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
在ModelArts的Notebook中如何获取本机外网IP？ - AI开发平台ModelArts

在ModelArts的Notebook中如何获取本机外网IP？本机的外网IP地址可以在主流搜索引擎中搜索“IP地址查询”获取。图1 查询外网IP地址父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
如何通过docker镜像启动容器？ - AI开发平台ModelArts

如何通过docker镜像启动容器？ Notebook保存后的镜像有Entrypoint参数，如图1。Entrypoint参数中指定的可执行文件或命令会覆盖镜像的默认启动命令，Entrypoint中指定的执行命令内容不在镜像中预置，在本地环境通过docker run启动通过Note

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
连接远端开发环境时，一直处于"Setting up SSH Host xxx: Copying VS Code Server to host with scp"超过10分钟以上，如何解决？ - AI开发平台ModelArts

连接远端开发环境时，一直处于"Setting up SSH Host xxx: Copying VS Code Server to host with scp"超过10分钟以上，如何解决？问题现象原因分析通过查看日志发现本地vscode-scp-done.flag显示成功上传，但远端未接收到。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

请求体的大小不超过12MB，超过后请求会被拦截。因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。 WebSocket在线服务调用 WebSocket协议本身不提供额外的认证方式。不管自定义镜像里面是ws还是wss，经过ModelArts平台出去的WebSocket协议都是wss的。同时ws

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
镜像在SWR上显示只有13G，安装少量的包，然后镜像保存过程会提示超过35G大小保存失败，为什么？ - AI开发平台ModelArts

镜像在SWR上显示只有13G，安装少量的包，然后镜像保存过程会提示超过35G大小保存失败，为什么？问题现象我的镜像在SWR侧看，只有13G左右，在开发环境Notebook镜像管理注册，启动Notebook实例后，安装一些包后，镜像保存过程会提示超过35G大小，保存失败？原因分析 SWR侧看到的大小是镜像压缩后的大小，解压后实际大小一般是压缩后的2

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。操作步骤 VPC访问通道访问在线服务操作步骤如下：获取ModelArts终端节点服务地址购买连接ModelArts终端节点

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
如何将在ModelArts中训练好的模型下载或迁移到其他账号？ - AI开发平台ModelArts

账号？通过训练作业训练好的模型可以下载，然后将下载的模型上传存储至其他账号对应区域的OBS中。获取模型下载路径登录ModelArts管理控制台，在左侧导航栏中选择“模型训练 > 训练作业”，进入“训练作业”列表。在训练作业列表中，单击目标训练作业名称，查看该作业的详情。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

更多功能介绍请参见TensorBoard官网资料。关闭TensorBoard 关闭TensorBoard方式如下：单击下图所示的，进入TensorBoard实例管理界面，该界面记录了所有启动的TensorBoard实例，单击对应实例后面的SHUT DOWN即可停止该实例。图3 单击SHUT DOWN停该实例

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
ECS服务器挂载SFS Turbo存储 - AI开发平台ModelArts

apt-get update sudo apt-get install nfs-common 获取SFS Turbo的挂载命令。进入弹性文件服务SFS管理控制台。选择“SFS Turbo”进入文件系统列表，单击文件系统名称，进入详情页面。在“基本信息”页签获取并记录“Linux挂载命令”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
使用AWQ或SQ压缩后的模型新增版本时，权重校验失败 - AI开发平台ModelArts

使用AWQ或SQ压缩后的模型新增版本时，权重校验失败问题现象使用AWQ或SQ压缩后的模型新增版本时，开启权重校验功能，权重校验失败。原因分析平台暂不支持压缩后的模型进行权重校验。问题影响压缩后的模型无法使用权重检验。处理方法模型压缩后，不建议进行权重校验。父主题： Studio

帮助中心 > AI开发平台ModelArts > 常见问题 > Studio
JupyterLab常用功能介绍 - AI开发平台ModelArts

JupyterLab视频介绍 JupyterLab主页介绍下面介绍如何从运行中的Notebook实例打开JupyterLab。登录ModelArts管理控制台，在左侧菜单栏中选择“开发空间 > Notebook”，进入Notebook页面。选择状态为“运行中”的Notebook实例，单击

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
服务部署、启动、升级和修改时，拉取镜像失败如何处理？ - AI开发平台ModelArts

服务部署、启动、升级和修改时，拉取镜像失败。原因分析节点磁盘不足，镜像大小过大。解决方法首先考虑优化镜像，减小节点磁盘的占用。优化镜像无法解决问题，请联系系统管理员处理。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

昇腾云服务6.3.905版本说明本文档主要介绍昇腾云服务6.3.905版本配套的镜像地址、软件包获取方式和支持的特性能力。配套的基础镜像镜像地址获取方式镜像软件说明配套关系 PyTorch：西南-贵阳一 swr.cn-southwest-2.myhuaweicloud

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

训练作业使用MoXing复制数据较慢，重复打印日志问题现象 ModelArts训练作业使用MoXing复制数据较慢。重复打印日志“INFO:root:Listing OBS”。原因分析复制数据慢的可能原因如下：直接从OBS上读数据会造成读数据变成训练的瓶颈，导致迭代缓慢。

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
在线服务预测报错MR.0105 - AI开发平台ModelArts

在线服务预测报错MR.0105 问题现象部署为在线服务，服务处于运行中状态，预测时报错：{ "erno": "MR.0105", "msg": "Recognition failed","words_result": {}}。图1 预测报错原因分析请在“在线服务”详情页面

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
在线服务预测报错ModelArts.4302 - AI开发平台ModelArts

在线服务预测报错ModelArts.4302 问题现象在线服务部署完成且服务已经处于“运行中”的状态后，向运行的服务发起推理请求，报错ModelArts.4302。原因分析及处理方法服务预测报错ModelArts.4302有多种场景，以下主要介绍两种场景： "error_msg":

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测

总条数： 2660

上一页
1
...
50
51
52
...
133
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

复制数据至容器中空间不足 - AI开发平台ModelArts

训练作业进程被kill - AI开发平台ModelArts

用户执行huaweicloud.com相关API超时 - AI开发平台ModelArts

tensorboard显示502 bad gateway - AI开发平台ModelArts

在ModelArts的Notebook中如何获取本机外网IP？ - AI开发平台ModelArts

如何通过docker镜像启动容器？ - AI开发平台ModelArts

连接远端开发环境时，一直处于"Setting up SSH Host xxx: Copying VS Code Server to host with scp"超过10分钟以上，如何解决？ - AI开发平台ModelArts

使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

镜像在SWR上显示只有13G，安装少量的包，然后镜像保存过程会提示超过35G大小保存失败，为什么？ - AI开发平台ModelArts

通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

如何将在ModelArts中训练好的模型下载或迁移到其他账号？ - AI开发平台ModelArts

在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

ECS服务器挂载SFS Turbo存储 - AI开发平台ModelArts

使用AWQ或SQ压缩后的模型新增版本时，权重校验失败 - AI开发平台ModelArts

JupyterLab常用功能介绍 - AI开发平台ModelArts

服务部署、启动、升级和修改时，拉取镜像失败如何处理？ - AI开发平台ModelArts

昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

在线服务预测报错MR.0105 - AI开发平台ModelArts

在线服务预测报错ModelArts.4302 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线