AI开发平台MODELARTS-GP Ant8裸金属服务器Ubuntu 20.04安装NVIDIA 525+CUDA 12.0:场景描述

时间:2024-09-05 08:36:23

场景描述

本文旨在指导完成GP Ant8裸金属服务器装机和nccl-test测试。装机软件预览如下:

表1 装机软件

软件类型

版本详情

预置操作系统

Ubuntu 20.04 server 64bit

驱动版本

525.105.17

nvidia-cuda

12.0

nvidia-fabricmanager

515.10.17(必须和驱动版本保持一致)

mlnx-ofed-linux

5.8-2.0.3.0/5.4-3.6.8.1(可选)

nvidia-peer-memory-dkms

1.2-0

nccl

libnccl2=2.16.2-1+cuda12.0 libnccl-dev=2.16.2-1+cuda12.0

nccl-test

v.2.13.6

support.huaweicloud.com/usermanual-modelarts-lite/usermanual-modelarts-lite-0075.html