云容器引擎 CCE-通过节点池升级节点的GPU驱动版本:步骤一:指定节点池驱动版本

时间:2024-05-31 08:37:31

步骤一:指定节点池驱动版本

  1. 登录节点查看节点上实际的驱动,驱动版本为510.47.03。

    # 插件版本为2.0.0以下时,执行以下命令:  
    cd /opt/cloud/cce/nvidia/bin && ./nvidia-smi   
    # 插件版本为2.0.0及以上时,驱动安装路径更改,需执行以下命令:  
    cd /usr/local/nvidia/bin && ./nvidia-smi

  2. 登录CCE控制台,单击集群名称进入集群控制台。
  3. 在集群的插件中心,找到 CCE AI套件(NVIDIA GPU),单击“编辑”
  4. 通过节点池更新节点上的显卡驱动,在“驱动选择”下方选择需要更新驱动的节点池,填写驱动链接,单击“安装”。

    本文档中更新后的驱动为535.54.03,链接为NVIDIA官网链接。如果节点无法访问公网,请先下载驱动然后上传到OBS桶中,然后将驱动的OBS链接填在此处,详情请参见获取驱动链接-OBS地址

  5. 等待插件状态变为“运行中”
support.huaweicloud.com/usermanual-cce/cce_10_0849.html