云容器引擎 CCE-选择GPU节点驱动版本:如何选择GPU节点驱动版本
如何选择GPU节点驱动版本
一般情况下,使用GPU资源时您将会使用以下软件包,并且软件包版本需要保持配套:
- 驱动GPU工作的硬件驱动程序,如Tesla系列驱动。
- 上层应用程序所需要的库,如CUDA Toolkit工具包。
在容器使用场景下,GPU驱动是安装在节点上的,而CUDA Toolkit一般会在应用程序的容器镜像构建时预安装,或者可直接使用Nvidia官方已预装CUDA Toolkit的基础镜像构建应用容器镜像。GPU驱动和CUDA Toolkit版本需要配套才可以正常使用GPU资源。
您可以使用nvidia-smi命令查看的节点上驱动信息,确定Nvidia驱动与CUDA Toolkit版本的配套关系,如下图,驱动版本为470.141.03, 对应支持的CUDA Toolkit最大版本为11.4。