应用运维管理 AOM-概述:控制台说明

时间:2023-11-01 16:20:25

控制台说明

表1 监控中心控制台说明

类别

说明

接入中心

通过接入中心可快速接入需要监控的业务层、应用层、中间件层、基础设施层指标,接入完成后,即可方便地在“应用监控”、“指标浏览”“云服务监控”等页面查看相关资源或应用的运行状态、各个指标的使用情况等信息。

仪表盘

通过仪表盘可将不同资源数据图表展示到同一个屏幕上,通过不同的图表形式来展示资源数据,例如,折线图、数字图、状态图等,帮助用户全面、深入地掌握监控数据。

告警管理

提供告警列表、事件列表、告警规则、告警通知等功能。

  • 告警列表

    告警是指 AOM 自身或外部服务在异常情况或在可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。

    告警列表展示已设时间范围内产生的告警。

  • 事件列表

    事件告诉您AOM自身或外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。

    事件列表展示已设时间范围内产生的事件。

  • 告警规则

    通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件,以便您在第一时间发现异常并进行处理。

  • 告警通知

    AOM提供了告警通知功能,通过创建告警行动规则或告警降噪进行告警通知详细配置,当AOM自身或外部服务存在异常或可能存在异常而产生告警时,将告警信息通过邮件、短信、企业微信等方式发送给指定的人员,以便提醒相关人员及时采取措施清除故障,避免造成业务损失。

应用洞察

主要提供应用监控功能。

  • 应用监控

    应用是您根据业务需要,对相同或者相近业务的一组组件进行逻辑划分,AOM提供以应用维度整体进行监控。

容器洞察

提供工作负载监控、集群监控等功能。

  • 工作负载监控

    工作负载监控的对象通过CCE部署的工作负载,通过工作负载监控可及时了解工作负载的资源使用、状态和告警等信息。

  • 集群监控

    集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控展示集群的Pods运行状态、CPU使用率等信息。

指标浏览

指标浏览展示了各资源的指标数据,您可实时监控指标值及趋势,还可对关注的指标进行创建告警规则等操作,以便实时查看业务及分析数据关联分析。

基础设施监控

主要提供云服务监控功能。

  • 云服务监控

    以曲线图、数字图等形式直观展示华为云各服务实例的运行状态、各个指标的使用情况等信息,并支持对监控项创建告警规则。

Prometheus监控

Prometheus监控全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘,可灵活扩展云原生组件指标插件。通过CCE安装Prometheus后,将指标数据对接到AOM,即可通过AOM统一管理指标和告警数据。

业务监控

主要提供创建日志指标规则功能。

日志分析

提供日志搜索、接入LTS等功能。

  • 日志搜索

    当需要通过日志来分析和定位问题时,使用日志搜索功能可帮您快速在海量日志中查询到所需的日志,您还可结合日志的来源信息和上下文原始数据一起辅助定位问题。

  • 日志接入

    将主机待采集日志的路径配置到日志流中,ICAgent将按照日志采集规则采集日志,并将多条日志进行打包,以日志流为单位发往AOM,您可以在AOM控制台实时查看日志。

  • 接入LTS

    通过添加接入规则,可以将AOM中的CCE、CCI或自定义集群的日志映射至LTS,通过LTS查看和分析日志。映射不会产生额外的费用(除重复映射外)。

进程发现

通过配置进程发现规则发现和收集主机上的进程和关联的指标。

数据订阅

支持用户订阅指标或者告警信息,订阅后可以将数据转发到用户配置的kafka或DMS的Topic中,供消费者消费转发的订阅的信息。

support.huaweicloud.com/usermanual-aom2/mon_01_0002.html