AI开发平台MODELARTS-GP Ant8裸金属服务器Ubuntu 20.04安装NVIDIA 515+CUDA 11.7:场景描述

时间:2024-09-05 08:36:23

场景描述

本文旨在指导完成GP Ant8裸金属服务器装机和nccl-test测试。装机软件预览如下:

表1 装机软件

软件类型

版本详情

预置操作系统

Ubuntu 20.04 server 64bit

驱动版本

515.10.01

nvidia-cuda

11.7

nvidia-fabricmanager

515.10.01(必须和驱动版本保持一致)

mlnx-ofed-linux

5.8-2.0.3.0/5.4-3.6.8.1(可选)

nvidia-peer-memory-dkms

1.2-0

nccl

libnccl2=2.14.3-1+cuda11.7 libnccl-dev=2.14.3-1+cuda11.7

nccl-test

v.2.13.6

support.huaweicloud.com/usermanual-modelarts-lite/usermanual-modelarts-lite-0076.html