云容器引擎 CCE-GPU视图:指标说明

时间:2024-05-31 08:37:52

指标说明

图1 GPU资源指标
表1 GPU图表说明

图表名称

单位

说明

集群-显存使用率

百分比

集群的显存使用率

计算公式:集群内容器显存使用总量/集群内显存总量

集群-算力使用率

百分比

集群的算力使用率

计算公式:集群内容器算力使用总量/集群内算力总量

节点-显存使用量

字节

每个节点的显存使用量

节点-算力使用率

百分比

每个节点的算力使用率

计算公式:节点上容器算力使用总量/节点上算力总量

节点-显存使用率

百分比

每个节点的显存使用率

计算公式:节点上容器显存使用总量/节点上显存总量

GPU卡-显存使用量

字节

每张GPU的显存使用量

计算公式:显卡上容器显存使用总量/显卡的显存总量

GPU卡-算力使用率

百分比

每张GPU卡的算力使用率

计算公式:显卡上容器算力使用总量/显卡的算力总量

GPU卡-温度

摄氏度

每张GPU卡的温度

GPU-显存频率

赫兹

每张GPU卡的显存频率

GPU卡-PCle带宽

字节/秒

每张GPU卡的PCle带宽

support.huaweicloud.com/usermanual-cce/cce_10_0759.html