AI开发平台MODELARTS-查看资源池详情:查看资源池监控

时间:2024-07-21 14:13:06

查看资源池监控

在资源池详情页,切换到“监控”页签。展示了CPU使用量、内存利用率、磁盘可用容量等使用情况,均以资源池的维度呈现。当资源池中有AI加速卡时,还会显示GPU、NPU的相关监控信息。

图4 查看资源视图
表1 监控指标

名称

指标含义

单位

取值范围

CPU使用量

该指标用于统计测量对象的CPU使用率。

百分比(Percent)

0~100%

内存利用用率

该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。

百分比(Percent)

0~100%

GPU显卡使用量

该指标用于统计测量对象已使用的显存占显存容量的百分比。

百分比(Percent)

0~100%

GPU显存使用量

该指标用于统计测量对象已使用的显存。

兆字节(Megabytes)

≥0

NPU显卡使用量

该指标用于统计测量对象已使用的NPU显存占NPU存储容量的百分比。

百分比(Percent)

0~100%

NPU显存使用量

该指标用于统计测量对象已使用的NPU显存。

≥0

≥0

磁盘可用容量

该指标用于统计测量对象可用的磁盘容量。

≥0

≥0

磁盘容量

该指标用于统计测量对象磁盘总容量。

≥0

≥0

磁盘利用率

该指标用于统计测量对象的磁盘使用率。

百分比(Percent)

0~100%

GPU/NPU碎片数

由于资源调度产生碎片,导致某些卡虽然空闲,但无法被多卡任务所使用。不同卡数的任务,根据已占用卡的分布不同,实际会有不同的碎片情况,且随时间变化,表格中仅表示当前时间的状态。

/

/

support.huaweicloud.com/resmgmt-modelarts/resmgmt-modelarts_0005.html