-
GP Ant1裸金属服务器支持的镜像详情 - AI开发平台ModelArts
GP Ant1裸金属服务器支持的镜像详情 镜像:EulerOS纯净版 镜像名称:EulerOS2.10 x86 64bit sdi3 for Ant1 BareMetal 表1 镜像详情 软件类型 版本详情 操作系统 EulerOS 2.10 64bit 架构类型 x86 RoCE路由配置
-
华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts
userdata机制拉取cce-agent,但是在服务器上查看没有拉cce-agent的动作,理论上该动作是cloudinit中的脚本在创建时自动执行的,可能是由于安装脚本没有注入userdata或者注入了但未执行。 经查看是由于userdata未执行,可能原因为服务器A制作镜像时没有清理残留目录导致,即:
-
GP Ant8裸金属服务器支持的镜像详情 - AI开发平台ModelArts
GP Ant8裸金属服务器支持的镜像详情 镜像1:Ubuntu20.04 With Nvidia Driver 525 镜像名称:Ubuntu 20.04 x86 64bit SDI3 for Ant8 BareMetal with RoCE and NVIDIA-525 CUDA-12
-
NPU Snt9裸金属服务器支持的镜像详情 - AI开发平台ModelArts
NPU Snt9裸金属服务器支持的镜像详情 镜像:EulerOS纯净版 镜像名称:ModelArts-Euler2.8_Aarch64_Snt9_C78 表1 镜像详情 软件类型 版本详情 操作系统 EulerOS 2.0 (SP8) 内核版本 4.19.36-vhulk1907
-
裸金属服务器支持IPV6解决方案 - AI开发平台ModelArts
的华为云裸金属服务器规格支持IPV6,只有当该裸金属服务器规格支持IPV6时,才有必要进行后续IPV6依赖项的操作。 确认镜像支持IPV6。如果未支持,需要更新该镜像属性,以支持IPV6。 查询方式请参考查询镜像列表。 调用API传入镜像ID,若响应体中有“__support_ipv6”:
-
GP Vnt1裸金属服务器支持的镜像详情 - AI开发平台ModelArts
GP Vnt1裸金属服务器支持的镜像详情 GP Vnt1规格在北京四、北京一和上海一虽然规格相同,但是产品的配置、发布时间都存在很大差异,因此镜像不能共用。 镜像1:Ubuntu18.04 纯净版(仅限于北京四) 镜像名称:Ubuntu-18.04-server-64bit-for-Vnt1-BareMetal
-
物理机环境配置 - AI开发平台ModelArts
sh 配置完成后,执行“df -h”可以看到新挂载的磁盘信息。 图3 查看新挂载的磁盘 磁盘合并挂载后,即可在“/home”下创建自己的工作目录,以自己的名字命名。 步骤3:(可选)安装固件和驱动 查看环境信息。查看当前拿到的机器的固件和驱动版本: npu-smi info -t board
-
GPU A系列裸金属服务器节点内NVLINK带宽性能测试方法(Pytorch模式) - AI开发平台ModelArts
问题。 硬件问题:如果GPU之间的NVLINK连接存在硬件故障,那么这可能会导致带宽受限。重新安装软件后,重启系统,可能触发了某种硬件自检或修复机制,从而恢复了正常的带宽。 系统负载问题:最初测试GPU卡间带宽时,可能存在其他系统负载,如进程、服务等,这些负载会占用一部分网络带宽
-
GPU A系列裸金属服务器没有任务,GPU被占用问题 - AI开发平台ModelArts
GPU A系列裸金属服务器没有任务,GPU被占用问题 问题现象 服务器没有任务,但GPU显示被占用。 图1 显卡运行状态 处理方法 nvidia-smi -pm 1 父主题: FAQ
-
华为云BMS GO SDK和Python脚本实现裸金属服务器的操作系统切换 - AI开发平台ModelArts
SDK和Python脚本实现裸金属服务器的操作系统切换 场景描述 华为云BMS裸金属服务器在停机状态可以切换操作系统,本文介绍以下两种切换操作系统的方式: 使用BMS Go SDK的方式切换操作系统 使用Python封装API的方式切换操作系统 切换操作系统需满足以下条件: 当前裸金属服务器状态为停止状态。
-
使用GPU A系列裸金属服务器有哪些注意事项? - AI开发平台ModelArts
515+CUDA 11.7中的安装nvidia-fabricmanager方法。 NCCL必须和CUDA版本相匹配,可单击此处可查看配套关系和安装方法。 使用该裸金属服务器制作自定义镜像时, 必须清除残留文件,请参考清理文件。 父主题: FAQ
-
修改Notebook SSH远程连接配置 - AI开发平台ModelArts
密钥对可单击选择已有的密钥对或“立即创建”创建新的密钥对。 白名单IP地址的设置请参考设置远程连接IP地址。修改远程连接的可访问IP地址后, 原来已经建立的链接依然有效, 当链接关闭后失效;新打开建立的链接只允许当前设置的IP进行访问。 设置远程连接IP地址 图3 设置远程连接IP地址 此处的IP地址,请填写外网I
-
NPU Snt9B裸金属服务器算力查询 - AI开发平台ModelArts
Snt9B裸金属服务器算力查询 场景描述 本文介绍如何在Snt9B裸金属服务器查询对应算力。 操作步骤 Snt9B裸金属服务器执行如下命令进行查看,然后查看表1对应型号算力即可。 npu-smi info 结果如下图所示,name列为B1型号,根据表格可得B1的理论算力为400T。
-
NPU Snt9B裸金属服务器支持的镜像详情 - AI开发平台ModelArts
NPU Snt9B裸金属服务器支持的镜像详情 镜像名称:EulerOS-2.10-Arm-rc3-64bit-for-Snt9B-BareMetal-with-CANN7.0.RC1 表1 镜像详情 软件类型 版本详情 操作系统 EulerOS 2.10 内核版本 Linux 4
-
NPU Snt9B裸金属服务器环境配置 - AI开发平台ModelArts
NPU Snt9B裸金属服务器环境配置 场景描述 物理机环境配置 容器化个人调测环境搭建 父主题: 环境配置
-
裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts
发现“no-auto-default=*”是打开的状态,“no-auto-default=*”含义是关闭DH Client,无法使用DHCP获取IP。正常情况下裸金属服务器这个参数是被注释的状态。 当服务器有网卡配置文件, NetworkManager.service实现将VPC子网分配的私有IP写入网卡配置文件中。NetworkManager
-
场景描述 - AI开发平台ModelArts
AscendHub提供的镜像。如果镜像中预置的软件版本不是您期望的版本,可以自行安装替换。 开发形式推荐通过容器中暴露的SSH端口以远程开发的模式(VSCode SSH Remote、 Xshell)连接到容器中进行开发,可以在容器中挂载宿主机的个人存储目录,用于存放代码和数据。
-
容器化个人调测环境搭建 - AI开发平台ModelArts
步骤1:准备业务基础镜像 当前推荐的开发模式是在物理机上启动自己的docker容器进行开发。容器镜像可以使用自己的实际业务镜像,也可以使用ModelArts提供的基础镜像,ModelArts提供两种基础镜像:Ascend+PyTorch镜像、Ascend+Mindspore镜像。 根据所需要的环境拉取镜像。
-
GPU A系列裸金属服务器无法获取显卡问题解决方法 - AI开发平台ModelArts
GPU A系列裸金属服务器无法获取显卡问题解决方法 问题现象 在A系列裸金属服务器上使用PyTorch一段时间后,出现获取显卡失败的现象,报错如下: > torch.cuda.is_available() /usr/local/lib/python3.8/dist-package
-
如何设置SSH免密登录 - AI开发平台ModelArts
上传公钥到服务器。 例如用户名为root,服务器地址为192.168.222.213,则将公钥上传至服务器的命令如下: ssh-copy-id -i ~/.ssh/id_rsa.pub root@192.168.222.213 通过如下命令可以看到客户端写入到服务器的id_rsa