搜索_华为云

将Notebook的Conda环境迁移到SFS磁盘 - AI开发平台ModelArts

重新启动镜像激活SFS盘中的虚拟环境保存并共享虚拟环境前提条件创建一个Notebook，“资源类型”选择“专属资源池”，“存储配置”选择“SFS弹性文件服务器”，打开terminal。创建新的虚拟环境并保存到SFS目录创建新的conda虚拟环境。 # shell conda create --prefix

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境
不启用自动停止，系统会自动停掉Notebook实例吗？会删除Notebook实例吗？ - AI开发平台ModelArts

k实例吗？针对此问题，需要根据选择的不同资源规格进行说明。如果使用免费规格，Notebook实例将在运行1小时后，自动停止。如果72小时内没有再次启动，会释放资源，即删除此Notebook实例。因此使用免费规格时，关注运行时间并注意文件备份。如果使用收费的公共资源池，未启用

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

本案例介绍如何在Snt9B上进行分布式训练任务，其中Cluster资源池已经默认安装volcano调度器，训练任务默认使用volcano job形式下发lite池集群。训练测试用例使用NLP的bert模型，详细代码和指导可参考Bert。图1 任务示意图操作步骤拉取镜像。本测试镜像为bert_pretrain_

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
训练作业一直在等待中（排队）？ - AI开发平台ModelArts

有以下建议：公共资源池：公共资源池资源较少，高峰期如举办相关活动时会存在资源不足情况。有以下方法可以尝试：如果使用的是免费规格，可以换成收费规格，免费规格资源较少，排队概率高。规格选择卡数尽量少，如可以选择1卡，相比于选择8卡排队几率大大降低。可以尝试使用其他Region（如北京四切换为上海一）。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 创建训练作业
使用CES监控Lite Server资源 - AI开发平台ModelArts

本文主要介绍如何配置华为云BMS+CES联合提供的裸金属服务器的指标监控方案，可帮助您查看CPU相关监控指标、CPU负载类相关监控指标、内存相关监控指标、磁盘相关监控指标、磁盘I/O类、文件系统类、网卡类、软RAID相关监控指标和进程相关监控指标。裸金属服务器监控介绍监控概述请参考BMS官方文档

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
设置训练故障优雅退出 - AI开发平台ModelArts

使用场景随着模型规模和数据集的急剧增长，需要利用大规模的训练集训练大规模的神经网络。在大规模集群分布式训练时，会遇到集群中某个芯片、某台服务器故障，导致分布式训练任务失败。优雅退出是指中断的训练任务支持自动恢复，并可以在上一次训练中断的基础上继续训练，而不用从头开始。约束限制表1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
创建训练作业 - AI开发平台ModelArts

SSHReq 参数是否必选参数类型描述 key_pair_names 否 Array of strings SSH密钥对名称，可以在云服务器控制台（ECS）“密钥对”页面创建和查看。响应参数状态码： 201 表49 响应Body参数参数参数类型描述 kind String 训练作业类型。默认使用job。枚举值：

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
在线服务的API接口组成规则是什么？ - AI开发平台ModelArts

在线服务的API接口组成规则是什么？ AI应用部署成在线服务后，用户可以获取API接口用于访问推理。 API接口组成规则如下： https://域名/版本/infer/服务ID 示例如下： https://6ac81cdfac4f4a30be95xxxbb682.apig.xxx

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

GPU裸金属服务器使用EulerOS内核误升级如何解决 GPU A系列裸金属服务器没有任务但GPU被占用如何解决 GPU A系列裸金属服务器无法获取显卡如何解决 GPU裸金属服务器无法Ping通如何解决 GPU A系列裸金属服务器RoCE带宽不足如何解决？ GPU裸金属服务器更换NV

帮助中心 > AI开发平台ModelArts > 故障排除
ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。 Step1 构建新ModelArts Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压A

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。 Step1 构建新ModelArts Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压A

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。 Step1 构建新ModelArts Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压A

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。 Step1 构建新ModelArts Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压A

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
在线服务预测报错MR.0105 - AI开发平台ModelArts

在线服务预测报错MR.0105 问题现象部署为在线服务，服务处于运行中状态，预测时报错：{ "erno": "MR.0105", "msg": "Recognition failed","words_result": {}}。图1 预测报错原因分析请在“在线服务”详情页面

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。 Step1 构建新ModelArts Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压A

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
状态码 - AI开发平台ModelArts
状态码 - AI开发平台ModelArts

Failed 未满足前提条件，服务器未满足请求者在请求中设置的其中一个前提条件。 413 Request Entity Too Large 由于请求的实体过大，服务器无法处理，因此拒绝请求。为防止客户端的连续请求，服务器可能会关闭连接。如果只是服务器暂时无法处理，则会包含一个Retry-After的响应信息。

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
创建DevServer - AI开发平台ModelArts

arch String 服务器镜像架构类型。 ARM X86 image_id String 服务器镜像ID。 name String 服务器镜像名称。 server_type String 服务器类型。枚举值如下： BMS：裸金属服务器 ECS：弹性云服务器请求示例 POST

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

本文以“商超商品识别”模型为例，介绍如何在ModelArts Standard平台上将已有模型部署为在线服务的免费体验过程。案例中使用到的“商超商品识别”模型来源于AI Gallery，AI Gallery中提供了大量免费的模型供用户一键部署，进行AI体验学习。 “商超商品识别”模型可以识别81类常见超市

 帮助中心 > AI开发平台ModelArts > 快速入门
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

04内核自动升级？哪里可以了解Atlas800训练服务器硬件相关内容使用GPU A系列裸金属服务器有哪些注意事项？ GPU A系列裸金属服务器如何更换NVIDIA和CUDA？

帮助中心 > AI开发平台ModelArts > 常见问题
资源选择推荐 - AI开发平台ModelArts

SWR DEW ModelArts VPC ECS EVS 单机单卡按需购买。（并行文件系统） × 免费。免费。包月购买。免费。 × 按需购买。单机多卡 × 包月购买。（HPC型500G）免费。免费。包月购买。免费。包月购买。（Ubuntu 18.04，建

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练

总条数： 1364

上一页
1
...
4
5
6
...
69
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

将Notebook的Conda环境迁移到SFS磁盘 - AI开发平台ModelArts

不启用自动停止，系统会自动停掉Notebook实例吗？会删除Notebook实例吗？ - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

训练作业一直在等待中（排队）？ - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

设置训练故障优雅退出 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

在线服务的API接口组成规则是什么？ - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

在线服务预测报错MR.0105 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

状态码 - AI开发平台ModelArts

创建DevServer - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

资源选择推荐 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线