云容器引擎 CCE-选择GPU节点驱动版本:如何选择GPU节点驱动版本

时间:2024-05-31 08:37:49

如何选择GPU节点驱动版本

一般情况下,使用GPU资源时您将会使用以下软件包,并且软件包版本需要保持配套:

  • 驱动GPU工作的硬件驱动程序,如Tesla系列驱动。
  • 上层应用程序所需要的库,如CUDA Toolkit工具包。

在容器使用场景下,GPU驱动是安装在节点上的,而CUDA Toolkit一般会在应用程序的容器镜像构建时预安装,或者可直接使用Nvidia官方已预装CUDA Toolkit的基础镜像构建应用容器镜像。GPU驱动和CUDA Toolkit版本需要配套才可以正常使用GPU资源。

您可以使用nvidia-smi命令查看的节点上驱动信息,确定Nvidia驱动与CUDA Toolkit版本的配套关系,如下图,驱动版本为470.141.03, 对应支持的CUDA Toolkit最大版本为11.4。

图1 Nvidia驱动与CUDA Toolkit版本的配套关系
support.huaweicloud.com/usermanual-cce/cce_10_0846.html