搜索_华为云

示例：从 0 到 1 制作自定义镜像并用于训练（MindSpore+Ascend） - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MindSpore+Ascend）本案例介绍如何从0到1制作Ascend容器镜像，并使用该镜像在ModelArts平台上进行训练。镜像中使用的AI引擎是MindSpore，训练使用的资源是专属资源池的Ascend芯片。约束限制

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
如何查看账号ID和IAM用户ID - AI开发平台ModelArts

如何查看账号ID和IAM用户ID 使用IAM账号登录华为云。在页面右上方单击“控制台”，进入华为云管理控制台。图1 控制台入口在控制台右上角的账户名下方，单击“我的凭证”，进入“我的凭证”页面。图2 我的凭证在API凭证页面获取IAM用户名、用户ID、账号名和账号ID。

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
pipeline应用准备 - AI开发平台ModelArts

Lite做推理，所以迁移前需要用户先准备好自己的ONNX pipeline。下文以官方开源的图生图的Stable Diffusion v1.5的onnx pipeline代码为例进行说明。进入容器环境，创建自己的工作目录，由于在Snt9B裸金属服务器环境配置指南的配置环境步骤中，在启动

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？如果您在创建Notebook实例之后，打开Notebook时，因报错导致无法打开页面，您可以根据以下对应的错误码来排查解决。打开Notebook显示黑屏 Notebook打开后黑屏，由于代理问题导致，切换代理。打开Notebook显示空白

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > Notebook实例常见错误
服务部署 - AI开发平台ModelArts
服务部署 - AI开发平台ModelArts

服务启动失败服务部署、启动、升级和修改时，拉取镜像失败如何处理？服务部署、启动、升级和修改时，镜像不断重启如何处理？服务部署、启动、升级和修改时，容器健康检查失败如何处理？服务部署、启动、升级和修改时，资源不足如何处理？模型使用CV2包部署在线服务报错服务状态一直处于“部署中”

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

本文为用户提供如何将本地的自定义算法通过简单的代码适配，实现在ModelArts上进行模型训练与部署的全流程指导。场景描述本案例用于指导用户使用PyTorch1.8实现手写数字图像识别，示例采用的数据集为MNIST官方数据集。通过学习本案例，您可以了解如何在ModelAr

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
删除DevServer实例 - AI开发平台ModelArts

X86 image_id String 服务器镜像ID。 name String 服务器镜像名称。 server_type String 服务器类型。枚举值如下： BMS：裸金属服务器 ECS：弹性云服务器请求示例 DELETE https://{endpoint}/v1/{pr

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
停止DevServer实例 - AI开发平台ModelArts

X86 image_id String 服务器镜像ID。 name String 服务器镜像名称。 server_type String 服务器类型。枚举值如下： BMS：裸金属服务器 ECS：弹性云服务器请求示例 PUT https://{endpoint}/v1/{proj

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
资源购买 - AI开发平台ModelArts
资源购买 - AI开发平台ModelArts

创建密钥对，操作指导请参考如何创建密钥对？购买虚拟私有云VPC 虚拟私有云可以为您构建隔离的、用户自主配置和管理的虚拟网络环境，操作指导请参考创建虚拟私有云和子网。购买弹性云服务器ECS 如果您需要在服务器上部署相关业务，较之物理服务器，弹性云服务器的创建成本较低，并且可以在

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
启动DevServer实例 - AI开发平台ModelArts

X86 image_id String 服务器镜像ID。 name String 服务器镜像名称。 server_type String 服务器类型。枚举值如下： BMS：裸金属服务器 ECS：弹性云服务器请求示例 PUT https://{endpoint}/v1/{proj

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

Ant8，包含8张GPU卡以及8张RoCE网卡。关于Ant8裸金属服务器的购买，可以在华为云官网提工单至ModelArts云服务，完成资源的申请。步骤1 安装模型安装Megatron-Deepspeed框架。使用root用户SSH的方式登录GPU裸金属服务器，登录方式在华为云购买页面可以获取。拉

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
训练作业找不到GPU - AI开发平台ModelArts

可见的GPU： os.environ['CUDA_VISIBLE_DEVICES'] = '0,1,2,3,4,5,6,7' 其中，0为服务器的GPU编号，可以为0，1，2，3等，表明对程序可见的GPU编号。如果未进行添加配置则该编号对应的GPU不可用。父主题： GPU相关问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

服务部署、启动、升级和修改时，资源不足如何处理？问题现象启动服务失败，报错：资源不足，服务调度失败。（Schedule failed due to insufficient resources. Retry later.或ModelArts.3976：No resources

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
ModelArts最佳实践案例列表 - AI开发平台ModelArts

环境迁移开发环境本案例介绍如何将Notebook的Conda环境迁移到SFS磁盘上。使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 MindSpore PyCharm ToolKit工具目标检测本案例介绍如何在本地进行MindSpore模

 帮助中心 > AI开发平台ModelArts > 最佳实践
查询DevServer实例详情 - AI开发平台ModelArts

X86 image_id String 服务器镜像ID。 name String 服务器镜像名称。 server_type String 服务器类型。枚举值如下： BMS：裸金属服务器 ECS：弹性云服务器请求示例 GET https://{endpoint}/v1/{proj

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

在安装正向代理前，需要先购买一台弹性云服务器ECS（镜像可选择Ubuntu最新版本），并配置好弹性EIP，然后登录ECS进行正向代理Squid的安装和配置，步骤如下：如果没有安装Docker，执行以下命令进行Docker安装 curl -sSL https://get.daocloud

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
在ModelArts Standard运行GPU训练任务的准备工作 - AI开发平台ModelArts

用的资源选择。在ECS服务器挂载SFS Turbo存储在ECS服务器挂载SFS Turbo存储后，支持将训练所需的数据通过ECS上传至SFS Turbo。检查云服务环境。 ECS服务器和SFS的共享硬盘在相同的VPC或者对应VPC能够互联。 ECS服务器基础镜像用的是Ubuntu

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？问题现象在高性能8卡GPU的裸金属上的训练任务突然变慢，以前1个epoch约2小时执行完成，最近1个epoch需要2天才能执行完成，并且执行“nvidia-smi”也明显变很卡顿。原因分析根据现象描述可能出现了nvidia-smi

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
报错“An SSH installation couldn't be found”或者“Could not establish connection to instance xxx: 'ssh' ...”如何解决？ - AI开发平台ModelArts

establish connection to instance xxx: 'ssh' ...”如何解决？问题现象或 VS Code连接Notebook一直提示选择证书，且提示信息除标题外，都是乱码。选择证书后，如上图所示仍然没有反应且无法进行连接。原因分析当前环境未装OpenSSH或

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
服务部署、启动、升级和修改时，镜像不断重启如何处理？ - AI开发平台ModelArts

服务部署、启动、升级和修改时，镜像不断重启如何处理？原因分析容器镜像代码错误解决方法根据容器日志进行排查，修复代码，重新创建AI应用，部署服务。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署

总条数： 1069

上一页
1
...
5
6
7
...
54
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

示例：从 0 到 1 制作自定义镜像并用于训练（MindSpore+Ascend） - AI开发平台ModelArts

如何查看账号ID和IAM用户ID - AI开发平台ModelArts

pipeline应用准备 - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

服务部署 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

删除DevServer实例 - AI开发平台ModelArts

停止DevServer实例 - AI开发平台ModelArts

资源购买 - AI开发平台ModelArts

启动DevServer实例 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

训练作业找不到GPU - AI开发平台ModelArts

服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

ModelArts最佳实践案例列表 - AI开发平台ModelArts

查询DevServer实例详情 - AI开发平台ModelArts

ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

在ModelArts Standard运行GPU训练任务的准备工作 - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

报错“An SSH installation couldn't be found”或者“Could not establish connection to instance xxx: 'ssh' ...”如何解决？ - AI开发平台ModelArts

服务部署、启动、升级和修改时，镜像不断重启如何处理？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线