云容器引擎 CCE-基于GPU监控指标的弹性伸缩实践:前提条件

时间:2024-05-31 08:37:36

前提条件

  • 目标集群已创建,且集群中包含GPU节点,并已运行GPU相关业务。
  • 在集群中安装CCE AI套件(NVIDIA GPU),且插件的metrics API正常工作。您可以登录GPU节点,执行以下命令进行检查:
    curl {Pod IP}:2112/metrics

    其中{Pod IP}是GPU插件的Pod IP,返回指标结果则为正常。

  • 在集群中安装3.9.5及以上版本的云原生监控插件,且部署模式需选择“Server模式”。
support.huaweicloud.com/usermanual-cce/cce_10_0844.html