AOM 应用广泛,下面介绍AOM的四个典型应用场景,以便您深入了解。
运维指标智能分析
海量业务下,出现百种指标监控、KPI数据、调用跟踪数据等丰富但无关联的运维数据,如何通过应用、服务、实例、主机和事务等多视角分析关联指标和告警数据,自动完成故障根因分析;如何基于历史数据学习与运维经验库,对异常进行智能分析并给出可能原因。
AOM通过AI智能算法分析各类运维指标趋势变化,提前预测潜在异常,包括指标的增幅过高、规律变化等。
优势
场景智能识别:根据运维指标特征选择算法匹配,如状态跳变、周期异常等。
自适应算法:当出现过多告警时,自动调整算法参数抑制告警。
毛刺信号自动过滤:自动过滤掉偶然出现离散的毛刺信号,避免误报。
图1运维指标智能分析
巡检与问题定界
日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。
AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监控、 日志分析 、事件报警等功能,支持日常巡检资源、应用整体运行情况,及时发现并定界应用与资源的问题。
优势
应用自动发现:自动部署采集器,针对应用的运行环境,主动发现应用并进行监控。
跨 云服务 的分布式应用监控:对于同时使用了多种云服务的分布式应用,提供统一的运维平台,便于您对业务进行立体排查。
事件告警灵活通知:提供多种异常检测策略并支持丰富的异常事件触发方式及API。
图2巡检与问题定界
立体化运维
您需全方位掌控系统的运行状态,并快速响应各类问题。
AOM提供从云平台到资源,再到应用的监控和微服务调用链的立体化运维分析能力。
优势
体验保障:实时掌控业务KPI健康状态,对异常事务根因分析。
故障快速诊断:分布式调用追踪,快速找到异常故障点。
资源运行保障:实时监控容器、磁盘、网络等上百种资源运维指标集群->虚机->应用->容器异常关联分析。
图3立体化运维