搜索_华为云

模型训练计费项 - AI开发平台ModelArts

创建桶不收取费用，按实际使用的存储容量和时长收费弹性文件服务SFS Turbo 使用专属资源池进行训练时，支持挂载多个弹性文件服务SFS Turbo。用于存储模型训练的代码及输入输出数据。具体费用可参见弹性文件服务价格详情。按需计费包年/包月按文件系统所占用的存储空间容量和使用时长收费

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

出现此问题现象，通常是因为您部署的模型过大导致的。解决方法如下：精简模型，重新导入模型和部署上线。购买专属资源池，在部署上线为在线服务时，使用专属资源池进行部署。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
训练代码中，如何获取依赖文件所在的路径？ - AI开发平台ModelArts

由于用户本地开发的代码需要上传至ModelArts后台，训练代码中涉及到依赖文件的路径时，用户设置有误的场景较多。因此推荐通用的解决方案：使用os接口得到依赖文件的绝对路径，避免报错。以下示例展示如何通过os接口获得其他文件夹下的依赖文件路径。文件目录结构： project_root

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 编写训练代码
复制数据至容器中空间不足 - AI开发平台ModelArts

量是否过大，占用过多存储空间会出现inode耗尽的情况，导致空间不足。请排查是否使用的是GPU资源。如果使用的是CPU规格的资源，“/cache”与代码目录共用10G，会造成内存不足，请更改为使用GPU资源。请在代码中添加环境变量来解决。 import os os.system('export

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
IEF节点边缘服务部署失败 - AI开发平台ModelArts

搜索ModelArts使用的委托，例如“modelarts_agency”，单击委托名称进入“基本信息”页面。单击“授权”，添加Tenant Adiministrator权限，按操作指引完成授权。授权完成后，重新“启动”边缘服务，观察状态是否正常。原因分析2 部署边缘服务时，使用到IEF

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
如何将Ubuntu20.04内核版本从低版本升级至5.4.0-144-generic？ - AI开发平台ModelArts

其中版本为5.4.0-144-generic。第二条命令为重新生成GRUB引导程序的配置文件，用于在启动计算机时加载操作系统，命令将使用新安装的内核镜像更新GRUB的配置文件，以便在下次启动时加载新的内核。父主题： Lite Server

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
专属资源池计费项 - AI开发平台ModelArts

专属资源池使用计算资源的用量。具体费用可参见ModelArts价格详情。按需计费规格单价 * 计算节点个数 * 使用时长包年/包月规格单价 * 计算节点个数 * 购买时长计费示例以下案例中出现的资源规格和费用价格仅供参考，实际价格请参见各服务价格详情。示例：使用按需计费的专属资源池。计费项：计算资源费用

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
【下线公告】华为云ModelArts旧版自动学习下线公告 - AI开发平台ModelArts

2023年6月上线，并已作为主入口面向用户开放，用户可实现在租户账号下管理个人的作业与资源。下线旧版自动学习对现有用户的使用是否有影响？用户将无法再使用旧版自动学习的功能，且因旧版自动学习文件均存储于ModelArts统一管理账号下，用户无法找回旧版自动学习的作业记录。旧版自动学习如何升级到新版自动学习？

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
TensorFlow在OBS写入TensorBoard到达5GB时停止 - AI开发平台ModelArts

了OBS单次导入文件大小的上限，导致无法继续写入。处理方法如果在运行训练作业的过程中出现该问题，建议处理方法如下：推荐使用本地缓存的方式来解决，使用如下方法： import moxing.tensorflow as mox mox.cache() 父主题： OBS操作相关故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
导入AI应用对于镜像大小的限制 - AI开发平台ModelArts

间可在创建资源池时自定义设置，设置专属资源池容器引擎空间不会造成额外费用增加。如果使用的是OBS导入或者训练导入，则包含基础镜像、模型文件、代码、数据文件和下载安装软件包的大小总和。如果使用的是自定义镜像导入，则包含解压后镜像和镜像下载文件的大小总和。父主题：导入模型

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 模型管理 > 导入模型
数据处理场景介绍 - AI开发平台ModelArts

数据选择：数据选择一般是指从全量数据中选择数据子集的过程。数据可以通过相似度或者深度学习算法进行选择。数据选择可以避免人工采集图片过程中引入的重复图片、相似图片等问题；在一批输入旧模型的推理数据中，通过内置规则的数据选择可以进一步提升旧模型精度。数据增强：数据扩增通过简单的数据扩

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
部署上线任务提交失败 - AI开发平台ModelArts

动学习项目中提示“部署上线任务提交失败”的错误。修改建议方法1：进入“部署上线>在线服务”页面，将不再使用的服务删除，释放资源。方法2：如果您部署的在线服务仍需继续使用，建议申请增加配额。父主题：部署上线

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 部署上线
（可选）配置驱动 - AI开发平台ModelArts

（可选）配置驱动当专属资源池中的节点含有GPU/Ascend资源时，为确保GPU/Ascend资源能够正常使用，需要配置好对应的驱动。 Cluster支持两种配置驱动的方式：方式一：购买资源池时通过自定义驱动参数进行配置方式二：通过驱动升级功能对已有的资源池驱动版本进行升级

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
训练过程中无法找到so文件 - AI开发平台ModelArts

入so文件（自行在浏览器下载），再设置LD_LIBRARY_PATH，具体见2。不支持。尝试更换引擎，重新下发作业。或者使用自定义镜像创建作业，可参考使用自定义镜像创建作业。父主题：云上迁移适配故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
服务状态一直处于“部署中” - AI开发平台ModelArts

AI应用的端口没有配置，默认为8080，如您在自定义镜像配置文件中修改了端口号，需要在部署AI应用时，配置对应的端口号，使新的AI应用重新部署服务。如何修改默认端口号，请参考使用自定义镜像创建在线服务，如何修改默认端口。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
日志提示“errorMessage:The specified key does not exist” - AI开发平台ModelArts

检查OBS路径及内容格式是否正常。必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

将版本回退至pytorch1.3。必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

处理方法必现的问题，使用本地Pycharm远程连接Notebook调试安装。先远程登录到所选的镜像，使用“nvcc -V”查看目前镜像自带的CUDA版本。重装torch等，需要注意选择与上一步版本相匹配的版本。建议与总结在创建训练作业前，推荐您先使用ModelArts开发

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
资源超分对Notebook实例有什么影响？ - AI开发平台ModelArts

2U的CPU，运行Notebook时最大使用到2U的资源；内存同理，最少需要4.8G的内存，运行时最大使用到8U的内存。超分情况下会存在实例终止的风险。如1个8U的节点上同时启动了6个2U的实例，如果其中一个实例CPU使用增大到超过节点的上限（8U）时，k8S会将使用资源最多的实例终止掉。因

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
报错“ssh: connect to host xxx.pem port xxxxx: Connection refused”如何解决？ - AI开发平台ModelArts

为“运行中”后，再次执行远程连接。执行如下命令排查本地网络是否可以访问。 curl -kv <ssh域名>:<ssh端口> 如果端口不通，请检查本地网络。如果问题还未解决，请联系技术支持。图1 检查端口是否可以访问父主题： VS Code连接开发环境失败常见问题

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题

总条数： 2137

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

模型训练计费项 - AI开发平台ModelArts

自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

训练代码中，如何获取依赖文件所在的路径？ - AI开发平台ModelArts

复制数据至容器中空间不足 - AI开发平台ModelArts

IEF节点边缘服务部署失败 - AI开发平台ModelArts

如何将Ubuntu20.04内核版本从低版本升级至5.4.0-144-generic？ - AI开发平台ModelArts

专属资源池计费项 - AI开发平台ModelArts

【下线公告】华为云ModelArts旧版自动学习下线公告 - AI开发平台ModelArts

TensorFlow在OBS写入TensorBoard到达5GB时停止 - AI开发平台ModelArts

导入AI应用对于镜像大小的限制 - AI开发平台ModelArts

数据处理场景介绍 - AI开发平台ModelArts

部署上线任务提交失败 - AI开发平台ModelArts

（可选）配置驱动 - AI开发平台ModelArts

训练过程中无法找到so文件 - AI开发平台ModelArts

服务状态一直处于“部署中” - AI开发平台ModelArts

日志提示“errorMessage:The specified key does not exist” - AI开发平台ModelArts

日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

资源超分对Notebook实例有什么影响？ - AI开发平台ModelArts

报错“ssh: connect to host xxx.pem port xxxxx: Connection refused”如何解决？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线