-
停止DevServer实例 - AI开发平台ModelArts
同时支持包周期和按需; POST_PAID:按需模式; PRE_PAID: 包周期。 cloud_server CloudServer object 云服务信息。 endpoints_response Array of Endpoints objects 实例私有IP信息。 flavor String
-
启动DevServer实例 - AI开发平台ModelArts
BMS: 裸金属服务; ECS: 弹性云服务。 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 create_at Long 创建时间。 update_at Long 更新时间。 charging_mode String 计费模式。 COMMON: 同时支持包周期和按需;
-
NPU Snt9B裸金属服务器环境配置 - AI开发平台ModelArts
NPU Snt9B裸金属服务器环境配置 场景描述 物理机环境配置 容器化个人调测环境搭建 父主题: 环境配置
-
实时同步用户所有DevServer实例状态 - AI开发平台ModelArts
同时支持包周期和按需; POST_PAID:按需模式; PRE_PAID: 包周期。 cloud_server CloudServer object 云服务信息。 endpoints_response Array of Endpoints objects 实例私有IP信息。 flavor String
-
NPU Snt9B裸金属服务器算力查询 - AI开发平台ModelArts
NPU Snt9B裸金属服务器算力查询 场景描述 本文介绍如何在Snt9B裸金属服务器查询对应算力。 操作步骤 Snt9B裸金属服务器执行如下命令进行查看,然后查看表1对应型号算力即可。 npu-smi info 结果如下图所示,name列为B1型号,根据表格可得B1的理论算力为400T。
-
GP Ant8裸金属服务器支持的镜像详情 - AI开发平台ModelArts
14.3 nccl-test v.2.13.6 docker 20.10.23 RoCE路由配置 支持 镜像3:Ubuntu20.04 纯净版 镜像名称:Ubuntu 20.04 x86 64bit SDI3 for Ant8 BareMetal 表3 镜像详情 软件类型 版本详情
-
GP Ant1裸金属服务器支持的镜像详情 - AI开发平台ModelArts
GP Ant1裸金属服务器支持的镜像详情 镜像:EulerOS纯净版 镜像名称:EulerOS2.10 x86 64bit sdi3 for Ant1 BareMetal 表1 镜像详情 软件类型 版本详情 操作系统 EulerOS 2.10 64bit 架构类型 x86 RoCE路由配置
-
创建DevServer - AI开发平台ModelArts
ServerNetwork object 服务器网络信息。 root_volume 否 EvsVolume object 服务器系统盘信息。 server_type 否 String 服务器类型。 BMS: 裸金属服务 ECS: 弹性云服务 userdata 否 String 创建服务器时,用户自己定义数据。
-
GP Vnt1裸金属服务器支持的镜像详情 - AI开发平台ModelArts
镜像3:Euler 2.9纯净版(仅限于北京四和上海一) 镜像名称:Euler2.9-X86-for-Vnt1-BareMetal 表3 镜像详情 软件类型 版本详情 操作系统 EulerOS 2.9 64bit 架构类型 x86 镜像4:Centos 7.3纯净版(仅限于北京一) 镜像名称:CentOS
-
NPU Snt9裸金属服务器支持的镜像详情 - AI开发平台ModelArts
NPU Snt9裸金属服务器支持的镜像详情 镜像:EulerOS纯净版 镜像名称:ModelArts-Euler2.8_Aarch64_Snt9_C78 表1 镜像详情 软件类型 版本详情 操作系统 EulerOS 2.0 (SP8) 内核版本 4.19.36-vhulk1907
-
裸金属服务器支持IPV6解决方案 - AI开发平台ModelArts
裸金属服务器支持IPV6解决方案 场景描述 本文旨在介绍裸金属服务器支持IPV6所需配置。裸金属服务器支持IPV6需要依赖规格、镜像、子网、安全组,对这些依赖项设置完成后,即可以在该裸金属服务上使用IPV6进行网络通信。 操作步骤 确认裸金属服务器规格支持IPV6。需要确保要购买
-
使用GPU A系列裸金属服务器有哪些注意事项? - AI开发平台ModelArts
使用GPU A系列裸金属服务器有哪些注意事项? 使用华为云A系列裸金属服务器时有如下注意事项: nvidia-fabricmanager版本号必须和nvidia-driver版本号保持一致,可参考GP Ant8裸金属服务器Ubuntu 20.04安装NVIDIA 515+CUDA
-
查询用户所有DevServer实例列表 - AI开发平台ModelArts
同时支持包周期和按需; POST_PAID:按需模式; PRE_PAID: 包周期。 cloud_server CloudServer object 云服务信息。 endpoints_response Array of Endpoints objects 实例私有IP信息。 flavor String
-
GPU A系列裸金属服务器没有任务,GPU被占用问题 - AI开发平台ModelArts
GPU A系列裸金属服务器没有任务,GPU被占用问题 问题现象 服务器没有任务,但GPU显示被占用。 图1 显卡运行状态 处理方法 nvidia-smi -pm 1 父主题: FAQ
-
训练管理(旧版) - AI开发平台ModelArts
训练管理(旧版) 训练作业 训练作业参数配置 可视化作业 资源和引擎规格接口 作业状态参考 父主题: 历史API
-
NPU Snt9B裸金属服务器支持的镜像详情 - AI开发平台ModelArts
NPU Snt9B裸金属服务器支持的镜像详情 镜像名称:EulerOS-2.10-Arm-rc3-64bit-for-Snt9B-BareMetal-with-CANN7.0.RC1 表1 镜像详情 软件类型 版本详情 操作系统 EulerOS 2.10 内核版本 Linux 4
-
在k8s集群配置Ascend使用环境 - AI开发平台ModelArts
在k8s集群配置Ascend使用环境 前提条件 专属资源池未适配1.23以上的CCE版本,故在本指导适用于1.23版本CCE。 已购买资源,购买资源步骤请参考集群资源购买。 操作步骤 Step 1:登录节点 Step 2:配置kubectl工具 Step 3:准备业务基础镜像 Step
-
GPU A系列裸金属服务器节点内NVLINK带宽性能测试方法(Pytorch模式) - AI开发平台ModelArts
重启系统,可能触发了某种硬件自检或修复机制,从而恢复了正常的带宽。 系统负载问题:最初测试GPU卡间带宽时,可能存在其他系统负载,如进程、服务等,这些负载会占用一部分网络带宽,从而影响NVLINK带宽的表现。重新安装软件后,这些负载可能被清除,从而使NVLINK带宽恢复正常。 父主题:
-
NPU Snt9B裸金属服务器docker网络配置方案 - AI开发平台ModelArts
重启sshd服务,执行如下命令。 /usr/sbin/sshd 此时,有两种方式实现免密登录。 (推荐)方式一:重新制作docker镜像(推荐) 在一个容器内,参考NPU Snt9B裸金属服务器多机免密互通解决方案完成配置后,将该容器打包为镜像,上传到华为云容器管理服务SWR,其他各个机器从SWR中使用docker
-
NPU Snt9B裸金属服务器安装深度学习框架PyTorch - AI开发平台ModelArts
install wheel pip3 install typing_extensions 安装官方aarch64 torch1.11.0版本包。 # 安装1.11.0版本 wget https://download.pytorch.org/whl/torch-1.11.0-cp37-cp37