搜索_华为云

PyTorch1.0引擎提示“RuntimeError: std:exception” - AI开发平台ModelArts

PyTorch1.0引擎提示“RuntimeError: std:exception” 问题现象在使用PyTorch1.0镜像时，必现如下报错： “RuntimeError: std:exception” 原因分析 PyTorch1.0镜像中的libmkldnn软连接与原生torch的冲突，具体可参看文档。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
创建训练作业提示错误码ModelArts.2763 - AI开发平台ModelArts

创建训练作业提示错误码ModelArts.2763 问题现象创建训练作业时，提示ModelArts.2763 : 选择的支持实例无效，请检查请求中信息的合法性。原因分析用户选择的训练规格资源和算法不匹配。例如：算法支持的是GPU规格，创建训练作业时选择了ASCEND规格的资源类型。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

重装的包与镜像装CUDA版本不匹配问题现象在现有镜像基础上，重新装了引擎版本，或者编译了新的CUDA包，出现如下错误： 1.“RuntimeError: cuda runtime error (11) : invalid argument at /pytorch/aten/s

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
日志提示“Please upgrade numpy to >= xxx to use this pandas version” - AI开发平台ModelArts

日志提示“Please upgrade numpy to >= xxx to use this pandas version” 问题现象在安装其他包的时候，有依赖冲突，对numpy库有其他要求，但是发现numpy卸载不了。出现如下类似错误： your numpy version

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts

MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” 问题现象使用mindspore进行训练时，出现如下报错： [ERROR] RUNTIME(3002)model execute error, retCode=0x91

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
ECS服务器挂载SFS Turbo存储 - AI开发平台ModelArts

数据及算法已经上传至OBS，如果未上传，请参考上传数据和算法至OBS（首次使用时需要）。 ECS服务器和SFS的共享硬盘在相同的VPC或者对应VPC能够互联。 ECS服务器基础镜像需要用Ubuntu 18.04的。 ECS服务器和SFS Turbo需要在同一子网中。操作步骤在ECS服务器中设置华为云镜像源。 sudo

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905）本文档主要介绍如何在ModelArts Lite DevServer上，使用PyTorch_npu+华为自研Ascend Snt9B硬件，完成Open-Sora训练和推理。资源规格要求

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

JupyterLab中文件保存失败，如何解决？问题现象 JupyterLab中保存文件时报错如下：原因分析浏览器安装了第三方插件proxy进行了拦截，导致无法进行保存。在Notebook中的运行文件超过指定大小就会提示此报错。 jupyter页面打开时间太长。网络环境原因，是否有连接网络代理。解决方法

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 代码运行常见错误
创建Workflow服务部署节点 - AI开发平台ModelArts

服务备注，默认为空，不超过100个字符。否 str vpc_id 在线服务实例部署的虚拟私有云ID，默认为空，此时ModelArts会为每个用户分配一个专属的VPC，用户之间隔离。如需要在服务实例中访问名下VPC内的其他服务组件，则可配置此参数为对应VPC的ID。VPC一旦配置，不支持修改。当vpc_id与clus

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
训练作业失败，如何使用开发环境调试训练代码？ - AI开发平台ModelArts

训练作业失败，如何使用开发环境调试训练代码？在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VsCode）联接云上环境调试请参考使用本地IDE开发模型。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

Lite提供的模型convertor工具可以支持主流的模型格式到MindIR的格式转换，用户需要导出对应的模型文件，推荐导出为ONNX格式。如何导出ONNX模型 PyTorch转ONNX，操作指导请见此处。 PyTorch导出ONNX模型样例如下： import torch import

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
查询推理VPC访问通道信息的API - AI开发平台ModelArts

NS解析。 vpcep_info Array of InternalChannelDetail objects 检索到的VPC访问通道信息。表5 InternalChannelDetail 参数参数类型描述 vpcep_service_id String VPC访问通道vpcep终端节点服务ID。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

在ModelArts Standard上运行GPU多机多卡训练作业操作流程准备工作：购买服务资源（VPC/SFS/OBS/SWR/ECS）配置权限创建专属资源池（打通VPC） ECS服务器挂载SFS Turbo存储在ECS中设置ModelArts用户可读权限安装和配置OBS命令行工具

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 ModelArts的AI Gallery中提供了大量免费的模型供用户一键部署，进行AI体验学习。本文以“商超商品识别”模型为例，完成从AI Gallery订阅模型，到ModelArts一键部署为在线服务的免费体验过程。

帮助中心 > AI开发平台ModelArts > 快速入门
在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机多卡训练作业操作流程准备工作：购买服务资源（VPC、SFS、SWR和ECS）配置权限创建专属资源池（打通VPC）在ECS服务器挂载SFS Turbo存储在ECS中设置ModelArts用户可读权限安装和配置OBS命令行工具

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
资源池推理服务一直初始化中如何解决 - AI开发平台ModelArts

资源池推理服务一直初始化中如何解决问题现象创建资源池时作业类型选择了推理服务，资源池创建成功后推理一直显示“环境初始化。原因分析专属池网段和推理微服务dispatcher网段冲突，导致专属池上的VPCEP终端节点无法创建，该region无法使用此网段创建包含推理服务的资源池。

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

START_FAILED：启动失败； STOPPED：已停止； STOPPING：停止中； STOP_FAILED：停止失败。 vpc_id String 实例所在虚拟私有云ID。 endpoints Array of EndpointsRes objects 服务器的私有IP信息。 image

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
不同机型的对应的软件配套版本 - AI开发平台ModelArts

集群规模：50|200|1000|2000 集群网络模式：容器隧道网络|VPC 集群转发模式：iptables|ipvs huawei-npu npu-driver volcano 插件版本匹配关系请见表3。 RoCE 操作系统：Huawei Cloud EulerOS 2.0 64bit 内核版本：5

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
查询DevServer实例详情 - AI开发平台ModelArts

START_FAILED：启动失败； STOPPED：已停止； STOPPING：停止中； STOP_FAILED：停止失败。 vpc_id String 实例所在虚拟私有云ID。 endpoints Array of EndpointsRes objects 服务器的私有IP信息。 image

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
预测API的域名停用公告 - AI开发平台ModelArts

续提供推理服务，请您及时更新业务中的预测API的域名。若您使用的是VPC内部节点访问ModelArts推理的在线服务，预测API切换域名后，由于内网VPC无法识别公网域名，请提交工单联系华为云技术支持打通网络。父主题：产品变更公告

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品变更公告

总条数： 1331

上一页
1
...
4
5
6
...
67
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

PyTorch1.0引擎提示“RuntimeError: std:exception” - AI开发平台ModelArts

创建训练作业提示错误码ModelArts.2763 - AI开发平台ModelArts

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

日志提示“Please upgrade numpy to >= xxx to use this pandas version” - AI开发平台ModelArts

MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts

ECS服务器挂载SFS Turbo存储 - AI开发平台ModelArts

Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

创建Workflow服务部署节点 - AI开发平台ModelArts

训练作业失败，如何使用开发环境调试训练代码？ - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

查询推理VPC访问通道信息的API - AI开发平台ModelArts

在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

资源池推理服务一直初始化中如何解决 - AI开发平台ModelArts

实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

不同机型的对应的软件配套版本 - AI开发平台ModelArts

查询DevServer实例详情 - AI开发平台ModelArts

预测API的域名停用公告 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线