搜索_华为云

查询数据集导入任务的详情 - AI开发平台ModelArts

描述 cluster_id String MRS集群ID。可登录MRS控制台查看。 cluster_mode String MRS集群运行模式。可选值如下： 0：普通集群 1：安全集群 cluster_name String MRS集群名称。可登录MRS控制台查看。 database_name

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
更新Notebook实例 - AI开发平台ModelArts

变更实例规格”，在弹出的“变更实例规格”对话框中选择对应规格资源。图2 选择实例规格实例规格切换需要该规格所在的集群有其他规格才可以执行，当前上线的部分规格所在集群无其他规格，切换的时候会显示为空，所以不可进行切换，如北京四、上海一的GPU: 1*Tnt004(16GB)|CPU:

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

GPU裸金属服务器使用EulerOS内核误升级如何解决问题现象 GP Vnt1裸金属服务器，操作系统为EulerOS 2.9(基于CentOS制作的Linux发行版)，经常遇到服务器重启后，操作系统内核无故升级，导致系统上原安装的nvidia-driver等软件无法使用，只能卸载重新安装。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
创建导入任务 - AI开发平台ModelArts

cluster_id 否 String MRS集群ID。可登录MRS控制台查看。 cluster_mode 否 String MRS集群运行模式。可选值如下： 0：普通集群 1：安全集群 cluster_name 否 String MRS集群名称。可登录MRS控制台查看。 database_name

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
示例：从 0 到 1 制作自定义镜像并用于训练（PyTorch+CPU/GPU） - AI开发平台ModelArts

Step3 准备镜像主机准备一台Linux x86_64架构的主机，操作系统使用Ubuntu-18.04。您可以准备相同规格的弹性云服务器ECS或者应用本地已有的主机进行自定义镜像的制作。购买ECS服务器的具体操作请参考购买并登录Linux弹性云服务器。“CPU架构”选择“x86

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

本案例介绍如何在Snt9B上进行分布式训练任务，其中Cluster资源池已经默认安装volcano调度器，训练任务默认使用volcano job形式下发lite池集群。训练测试用例使用NLP的bert模型，详细代码和指导可参考Bert。图1 任务示意图操作步骤拉取镜像。本测试镜像为bert_pre

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
从0制作自定义镜像用于创建训练作业（PyTorch+CPU/GPU） - AI开发平台ModelArts

Step3 准备镜像主机准备一台Linux x86_64架构的主机，操作系统使用Ubuntu-18.04。您可以准备相同规格的弹性云服务器ECS或者应用本地已有的主机进行自定义镜像的制作。购买ECS服务器的具体操作请参考购买并登录Linux弹性云服务器。“CPU架构”选择“x86

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

关于Ant8裸金属服务器的购买，可以在华为云官网提工单至ModelArts云服务，完成资源的申请。步骤1 安装模型安装Megatron-DeepSpeed框架。使用root用户SSH的方式登录GPU裸金属服务器。具体登录方式请参见SSH密钥方式登录裸金属服务器。拉取pyto

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

弹性文件服务（Scalable File Service，SFS）提供按需扩展的高性能文件存储（NAS），可以在裸金属服务器中通过网络协议挂载使用，SFS支持NFS和CIFS的网络协议。在使用裸金属服务器时，将数据放在SFS盘中，并发建立多个NFS链接、并发的读写数据、做大模型训练。但有时候会出

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
创建诊断任务 - AI开发平台ModelArts

5 disable_profiling_comparison False 否关闭快慢卡算子比对。对于集群任务的profiling分析，如果存在快慢卡问题则会自动进行集群内部快慢卡的算子性能比对，包括npu侧计算的算子比对和cpu侧torch算子下发比对。当模型较大时，算子比

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
配额与限制 - AI开发平台ModelArts

Cluster或Lite Server时，所需的ECS实例数、内存大小、CPU核数和EVS硬盘大小等资源会超出华为云默认提供的资源配额，因此需要申请扩大配额。具体配额项如下。表1 ModelArts Lite涉及的资源配额服务资源类型 ECS资源类型 ECS实例数 CPU核心数 RAM容量（MB）

帮助中心 > AI开发平台ModelArts > 产品介绍
快速开始 - AI开发平台ModelArts
快速开始 - AI开发平台ModelArts

ModelArts SDK支持在本地安装配置使用。使用时，需进行Session鉴权。本地安装SDK。如果本地未安装SDK，可参考（可选）本地服务器安装ModelArts SDK安装；如果本地已安装，则无需再次安装。进行Session鉴权。可参见（可选）Session鉴权完成鉴权。鉴权完成后，即可开始使用。

帮助中心 > AI开发平台ModelArts > SDK参考
扩缩容Lite Cluster资源池 - AI开发平台ModelArts

ontainerd和Docker差异对比请见容器引擎。若CCE集群版本低于1.23，仅支持选择Docker作为容器引擎。若CCE集群版本大于等于1.27，仅支持选择Containerd作为容器引擎。其余CCE集群版本，支持选择Containerd或Docker作为容器引擎。修

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
准备MaaS资源 - AI开发平台ModelArts

5的专属资源池，其他版本会导致任务失败。当专属资源池的驱动版本不适配时，可以参考升级Standard专属资源池驱动升级驱动。公共资源池：公共资源池提供公共的大规模计算集群，根据用户作业参数分配使用，资源按作业隔离。MaaS服务可以使用ModelArts Standard形态下提供的公共资源池完成模型训推，按

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

观察队头是否有其他作业在排队，如果已有作业在排队，则新建的作业需要继续等待。如果通过排查计算，发现资源确实足够，则考虑可能由于资源碎片化导致的。例如，集群共2个节点，每个节点都空闲了4张卡，总剩余卡数为8张卡，但用户的作业要求为1节点8张卡，因此无法调度上。父主题： Standard专属资源池

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

Step4 准备镜像主机准备一台Linux x86_64架构的主机，操作系统使用ubuntu-18.04。您可以准备相同规格的弹性云服务器ECS或者应用本地已有的主机进行自定义镜像的制作。购买ECS服务器的具体操作请参考购买并登录Linux弹性云服务器。“CPU架构”选择“x86

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
配置IAM权限 - AI开发平台ModelArts

"Action": [ "vpc:*:*", "ecs:*:get*", "ecs:*:list*" ], "Effect": "Allow"

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
升级Lite Cluster资源池驱动 - AI开发平台ModelArts

U/Ascend资源。资源池驱动升级操作登录ModelArts管理控制台，在左侧菜单栏中选择“AI专属资源池 > 弹性集群 Cluster”，在“弹性集群”页面，选择“Lite资源池”页签，查看资源池列表。在资源池列表中，选择需要进行驱动升级的资源池“ > 驱动升级”。图1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
升级Lite Cluster资源池单个节点驱动 - AI开发平台ModelArts

PU/Ascend资源。节点驱动升级操作登录ModelArts管理控制台，在左侧菜单栏中选择“AI专属资源池 > 弹性集群 Cluster”，在“弹性集群”页面，选择“Lite资源池”页签，查看资源池列表。进入资源池详情页，在节点管理页面，选择需要进行驱动升级的节点，单击操作列的“更多

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
批量添加样本 - AI开发平台ModelArts

cluster_id 否 String MRS集群ID。可登录MRS控制台查看。 cluster_mode 否 String MRS集群运行模式。可选值如下： 0：普通集群 1：安全集群 cluster_name 否 String MRS集群名称。可登录MRS控制台查看。 database_name

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）

总条数： 924

上一页
1
...
7
8
9
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询数据集导入任务的详情 - AI开发平台ModelArts

更新Notebook实例 - AI开发平台ModelArts

GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

创建导入任务 - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（PyTorch+CPU/GPU） - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（PyTorch+CPU/GPU） - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

创建诊断任务 - AI开发平台ModelArts

配额与限制 - AI开发平台ModelArts

快速开始 - AI开发平台ModelArts

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

准备MaaS资源 - AI开发平台ModelArts

ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

配置IAM权限 - AI开发平台ModelArts

升级Lite Cluster资源池驱动 - AI开发平台ModelArts

升级Lite Cluster资源池单个节点驱动 - AI开发平台ModelArts

批量添加样本 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线