AI开发平台MODELARTS-GPU服务器上配置Lite Server资源软件环境:GP Vnt1裸金属服务器Ubuntu 18.04安装NVIDIA 470+CUDA 11.4

时间:2024-10-12 17:44:09

GP Vnt1裸金属服务器Ubuntu 18.04安装NVIDIA 470+CUDA 11.4

本小节旨在指导如何在GP Vnt1裸金属服务器上(Ubuntu 18.04系统),安装NVIDIA驱动版本470,CUDA版本11.4。

  1. 安装NVIDIA驱动。

    apt-get update
    sudo apt-get install nvidia-driver-470

  2. 安装CUDA。

    wget https://developer.download.nvidia.com/compute/cuda/11.4.4/local_installers/cuda_11.4.4_470.82.01_linux.run
    chmod +x cuda_11.4.4_470.82.01_linux.run
    ./cuda_11.4.4_470.82.01_linux.run --toolkit --samples --silent

  3. 验证NVIDIA安装结果。

    nvidia-smi -pm 1
    nvidia-smi
    /usr/local/cuda/bin/nvcc -V

  4. 安装Pytorch2.0和验证CUDA验证。

    PyTorch2.0所需环境为Python3.10, 安装配置miniconda环境。

    1. miniconda安装并创建alpha环境。
      wget https://repo.anaconda.com/miniconda/Miniconda3-py310_23.1.0-1-Linux-x86_64.sh
      chmod 750 Miniconda3-py310_23.1.0-1-Linux-x86_64.sh
      bash Miniconda3-py310_23.1.0-1-Linux-x86_64.sh -b -p /home/miniconda
      export PATH=/home/miniconda/bin:$PATH
      conda create --quiet --yes -n alpha python=3.10
    2. 安装pytorch2.0并验证cuda状态。
      在alpha环境下安装torch2.0,使用清华PIP源完成。
      source activate alpha
      conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia
      python
      验证torch与cuda的安装状态,输出为True即为正常。
      import torch
      print(torch.cuda.is_available())

support.huaweicloud.com/usermanual-server-modelarts/usermanual-server-0012.html