云容器实例 CCI-使用Nvidia-smi工具

时间:2024-10-29 16:37:49

使用Nvidia-smi工具

为了支持查看GPU使用情况的场景,需要在镜像中注入nvidia-smi工具,根据购买的专属节点GPU驱动版本选择不同的nvidia-smi二进制文件。

  1. nvidia-smi获取方式。

    该二进制文件可以在nvidia官网,根据CUDA Toolkit版本选择下载对应版本的nvidia驱动包。

    图1 NVIDIA驱动程序下载

    以CUDA 10.1为例,可以下载得到对应版本的驱动包NVIDIA-Linux-x86_64-418.126.run文件,执行如下命令解压缩:

    sh NVIDIA-Linux-x86_64-418.126.run -x

    在解压缩后的目录下即可找到官方提供的nvidia-smi工具二进制文件。

  2. 注入nvidia-smi工具。

    步骤1中得到的nvidia-smi二进制文件放在Dockerfile所在目录下,然后在同目录下的Dockerfile中新增注入语句:

    # inject nvidia-smi tool
    COPY nvidia-smi /usr/bin/
    RUN chmod +x /usr/bin/nvidia-smi
    COPY命令会从Dockerfile文件所在的当前目录下去寻找名为nvidia-smi的文件,然后拷贝到镜像的/usr/bin/目录下。

support.huaweicloud.com/bestpractice-cci/cci_04_0045.html