应用运维管理 AOM-事件根因分析:各异常事件的根因分析

时间:2024-10-28 20:24:57

各异常事件的根因分析

  • 应用服务整体平均响应时间突增:基于应用的调用链数据,针对应用粒度提供下钻分析,分析应用下每个组件的平均时延以快速定位根因,找到导致应用整体RT突增的具体组件。
    图1 应用服务整体平均响应时间突增
  • 应用服务整体错误率突增:基于应用的调用链数据,针对应用粒度提供下钻分析,分析应用下每个组件的错误率以快速定位根因,下钻到应用下具体组件的错误率异常。单击“查看调用链”,可详细追踪错误率突增的原因。
    图2 应用服务整体错误率突增
  • TopN接口平均响应时间突增:基于应用的调用链数据,针对接口粒度提供调用链响应时间分析,快速定位根因。
    图3 TopN接口平均响应时间突增
  • TopN接口错误率突增:基于应用的调用链数据,针对接口粒度提供调用链错误率分析,快速定位根因。单击“查看调用链”,可详细追踪错误率突增的原因。
    图4 TopN接口错误率突增
  • 应用服务整体流量不均:基于应用下所有实例的流量数据,展示应用下最大流量和最小流量实例的流量和时延数据,并展示应用下流量Top5的接口在最大流量和最小流量实例上的分布,快速定位受影响接口。单击所展示的接口,可详细追踪接口近期的调用情况。
    图5 应用服务整体流量不均-流量统计&流量分布
support.huaweicloud.com/usermanual-aom2/mon_01_0103.html