应用运维管理 AOM-普罗语句说明:普罗语句查询举例说明

时间:2025-01-23 04:57:08

普罗语句查询举例说明

  • 示例一:集群下指定pod占所在节点(不含控制节点)的内存使用率
    • 定义变量:
      • pod中容器内存实际占用量(同一个Pod下可能会有多个容器/实例):aom_container_memory_used_megabytes
      • node内存实际总量:aom_node_memory_total_megabytes
    • 查询逻辑:
      • 针对指标aom_container_memory_used_megabytes,使用聚合函数sum,按照nodeIP和podID进行指定node下指定pod当前的内存实际占用量计算。
      • 针对指标aom_node_memory_total_megabytes,使用聚合函数sum,按照nodeIP计算出指定node的内存总量。
      • 两者均采用(by nodeIP)进行过滤,以使获得的指标值具有相同的指标维度。(仅value不同)
      • 将上述两者获得的指标值进行“/”运算,即可获得pod的内存实际使用率。
    • pod的内存实际使用率的普罗语句如下所示:

      sum(aom_container_memory_used_megabytes{podID="****1461-41d8-****-bfeb-fc1213****",nodeIP="***.***.***.***"}) by (nodeIP) / sum(aom_node_memory_total_megabytes{nodeIP="***.***.***.***"}) by (nodeIP)

  • 示例二:集群下指定pod占所在节点(不含控制节点)的cpu使用率
    • 定义变量:
      • pod中容器的cpu实际使用量:aom_container_cpu_used_core
      • node的cpu实际总量:aom_node_cpu_limit_core
    • 查询逻辑:
      • 针对指标aom_container_cpu_used_core,使用聚合函数sum,按照nodeIP和podID计算指定node下指定pod当前使用的cpu使用率。
      • 针对指标aom_node_cpu_limit_core,使用聚合函数sum,按照nodeIP计算出指定node的cpu总量。
      • 两者均采用(by nodeIP)进行过滤,以使获得的指标值具有相同的指标维度。(仅value不同)
      • 将上述两者获得的指标值进行“/”运算,即可获得pod的内存实际使用率。
    • pod的cpu实际使用率的promQL如下所示:

      sum(aom_container_cpu_used_core{nodeIP="***.***.***.***",podID="****1461-41d8-****-bfeb-***13******"}) by (nodeIP) / sum(aom_node_cpu_limit_core{nodeIP="***.***.***.***"}) by (nodeIP)

  • 示例三:集群下运行的Pod内存配额申请值 / 集群下该Pod所在节点的内存可分配量
    • 定义变量:
      • pod中给容器分配的内存总量:aom_container_memory_request_megabytes
      • node内存实际总量:aom_node_memory_total_megabytes
    • 查询逻辑:
      • 针对指标aom_container_memory_request_megabytes,使用聚合函数sum,按照nodeIP和podID计算指定node下指定pod当前被分配的内存总量。
      • 针对指标aom_node_memory_total_megabytes,使用聚合函数sum,按照nodeIP计算出指定node的内存总量。
      • 两者均采用(by nodeIP)进行过滤,以使获得的指标值具有相同的指标维度。(仅value不同)
      • 将上述两者获得的指标值进行“/”运算,即可获得pod的内存实际分配率。
    • pod的内存实际分配率的promQL如下所示:

      sum(aom_container_memory_request_megabytes{podID="****1461-41d8-4403-****-f***35*****",nodeIP="***.***.***.***"}) by (nodeIP) / sum(aom_node_memory_total_megabytes{nodeIP="***.***.***.***"}) by (nodeIP)

  • 示例四:集群下运行的Pod的cpu配额申请值 / 集群下该Pod所在节点的cpu可分配量
    • 定义变量:
      • pod中容器的cpu实际分配总量:aom_container_cpu_limit_core
      • node的cpu实际分配总量:aom_node_cpu_limit_core
    • 查询逻辑:
      • 针对指标aom_container_cpu_limit_core,使用聚合函数sum,按照nodeIP和podID计算指定node下指定pod当前使用的cpu分配量。
      • 针对指标aom_node_cpu_limit_core,使用聚合函数sum,按照nodeIP计算出指定node的cpu总量。
      • 两者均采用(by nodeIP)进行过滤,以使获得的指标值具有相同的指标维度。(仅value不同)
      • 将上述两者获得的指标值进行“/”运算,即可获得pod的cpu实际分配率。
    • pod的cpu实际分配率的promQL如下所示:

      sum(aom_container_cpu_limit_core{podID="*****461-41d8-****-bfeb-****135*****",nodeIP="***.***.***.***"}) by (nodeIP) / sum(aom_node_cpu_limit_core{nodeIP="***.***.***.***"}) by (nodeIP)

support.huaweicloud.com/usermanual-aom2/mon_01_0043.html