应用运维管理 (Application Operations Management)是面向运维、开发、运营人员及IT经理的云上运维平台,以日志、指标、事件形式实时监控运行、运营数据,为您提供云资源、网络、中间件、上云业务等全链路的数百种运维指标,让您统一监控资源、上云业务,一站式完成云上运维。
应用监控
应用监控是针对资源和应用的监控,通过应用监控您可以及时了解应用的资源使用情况、趋势和告警,使用这些信息,您可以快速响应,保证应用流畅运行。
应用监控是逐层下钻设计,层次关系为:应用列表->应用详情->服务详情->实例详情->容器详情->进程详情。即在应用监控中,将应用、服务、实例、容器、进程做了层层关联,在界面上就可以直接得知各层关系。
主机监控
主机监控是针对主机的监控,通过主机监控您可以及时了解主机的资源使用情况、趋势和告警,使用这些信息,您可以快速响应,保证主机流畅运行。
主机监控的设计类似应用监控,主机的层级关系为:主机列表->主机详情。详情页面包含了当前主机上所发现的所有实例,显卡,网卡,磁盘,文件系统。
指标监控
AOM 提供指标监控界面来检索指标,通过资源的层级关系在指标树上进行展示。当前的资源关系为:集群->服务->实例->容器/进程。在指标监控界面您可以将同一资源的不同指标进行对比,也可将不同资源的同一指标进行对比。一个指标图表最多可展示12个指标。您还可将指标图表快速添加到仪表盘,以CSV或TXT文件形式导出指标数据到本地。
应用全景
应用全景以应用为中心,拉通服务、实例、主机、中间件等多维度关联分析。通过应用、服务、实例、主机和事务等多视角分析关联指标和告警数据,直击异常。
应用自动发现
您在主机上部署应用后,在主机上安装的ICAgent将自动收集应用信息,包括进程名称,应用名称,容器名称,Kubernetes pod名称等,自动发现的应用在界面上以图形化方式展示,支持您自定义别名和分组对资源进行管理。
仪表盘
通过仪表盘可将不同图表展示到同一个屏幕上,通过不同的仪表形式来展示资源数据,例如,曲线图、数字图、TopN图表等,进而全面、深入地掌握监控数据。
例如,可将重要资源的关键指标添加到仪表盘中,从而实时地进行监控。还可将不同资源的同一指标展示到同一个图形界面上进行对比。另外,对于例行运维需要查看的指标,可添加到仪表盘中,以便再次打开AOM时无需重新选择指标就可进行例行检查任务。
告警中心
告警中心是告警和事件的管理平台,支持自定义通知动作,即您可通过邮件、短信等方式获得告警信息,可帮您在第一时间发现异常及其根因。对于重点资源的指标您可以创建阈值规则,当指标数据满足阈值条件时,AOM会产生阈值告警,还可使用阈值告警订阅功能,将阈值告警对接到您的运维平台进行分析。
日志管理
提供强大的日志管理能力。日志检索功能可帮您快速在海量日志中查询到所需的日志;日志转储帮您实现长期存储;通过创建日志统计规则实现关键词周期性统计,并生成指标数据,实时了解系统性能及业务等信息;通过配置分词可将日志内容按照分词符切分为多个单词,在日志搜索时可使用切分后的单词进行搜索;开启日志订阅功能可将AOM的日志实时对接到您的运维平台。
AOM集成了应用性能管理服务(Application Performance Management,简称 APM )的相关功能(例如:拓扑图、调用链、端测分析、异常SQL分析等),通过与APM配合实现更高级监控,帮助运维人员快速解决应用在分布式架构下的问题定位和性能瓶颈等难题,为您的体验保驾护航。