弹性云服务器 ECS-(推荐)自动安装GPU加速型ECS的GPU驱动(Linux):操作步骤

时间:2024-07-31 19:37:18

操作步骤

以下操作以Ubuntu 20.04 64bit操作系统,P2v规格的GPU加速型实例安装CUDA 11.0对应的Tesla驱动为例进行介绍。

  1. 以root账号远程登录云服务器。
  2. 执行以下命令,获取驱动安装脚本并运行。

    wget -t 10 --timeout=10 https://hgcs-drivers-cn-east-2.obs.cn-east-2.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh

  3. 根据界面提示,选择需要安装的驱动版本。
    图1 选择驱动安装版本
  4. 卸载已安装驱动。

    如果云服务器已安装过驱动,请根据提示先执行驱动卸载操作。

    如果云服务器本身未安装驱动,脚本会自动跳过该步骤,开始进行驱动安装。

    1. 卸载CUDA Toolkit。
      图2 卸载CUDA Toolkit(1)
      图3 卸载CUDA Toolkit(2)
    2. 卸载GPU driver。
      图4 卸载GPU driver

    卸载完成后,开始安装驱动,此过程会持续几分钟,请耐心等待。

  5. 驱动安装完成后,会自动重启云服务器后,请重新以root账号登录。
  1. 执行以下命令,检查驱动是否安装成功。

    nvidia-smi

    如果返回信息中包含了已安装的驱动版本,说明驱动安装成功。

    图5 查看驱动安装结果
  2. 执行以下命令,检查CUDA版本是否正确。

    /usr/local/cuda/bin/nvcc -V

    图6 检查CUDA版本
  3. (可选)检查CUDA是否正常。
    1. 执行以下命令,进入“/usr/local/cuda/samples/1_Utilities/deviceQuery”目录。

      cd /usr/local/cuda/samples/1_Utilities/deviceQuery

    2. 执行以下命令,自动编译deviceQuery程序。

      make

    3. 执行以下命令,查看CUDA是否安装成功。

      ./deviceQuery

      如果返回信息中有CUDA的版本信息,则表明CUDA安装成功。

      图7 查看CUDA安装结果
support.huaweicloud.com/usermanual-ecs/ecs_03_0199.html