华为云计算 云知识 应用运维管理
应用运维管理

应用运维管理 (Application Operations Management)是面向运维、开发、运营人员及IT经理的云上运维平台,以日志、指标、事件形式实时监控运行、运营数据,为您提供云资源、网络、中间件、上云业务、手机APP等全链路的数百种运维指标,让您统一监控资源、上云业务,一站式完成云上运维。

产品优势

立体运维

提供覆盖应用性能、应用状态、基础设施状态、云资源使用情况的一站式立体运维平台。

关联分析

以应用为中心,覆盖组件、实例、主机、云资源等多维度关联分析,迅速找到异常根因。

智能分析

AI智能阈值自动检测,机器学习历史基线数据产生告警,通过RCA分析找到问题根因。

开箱即用

无需修改业务代码即可接入使用,非侵入式数据采集,安全无忧。

应用场景

AOM 应用广泛,下面介绍AOM的四个典型应用场景,以便您深入了解。

端到云全链路监控

当出现页面加载较慢或者网站卡顿等诸多端侧性能问题时,如果无法复现问题,就很难快速发现性能瓶颈并精准定位具体原因。例如:当页面加载较慢时,是网络问题、资源加载问题,还是页面DOM(Document Object Model)解析问题?是与所在的省份、国家有关系,还是与浏览器、设备有关系?当网站出现卡顿现象,是终端到服务端的网络问题,是服务端负载过高导致响应变慢,还是 数据库 压力过大?即使定位到了导致卡顿的环节,也很难快速定位到代码层面的根本原因。

AOM提供覆盖从Browser或Mobile端侧、网络、WEB服务、数据中心的全链路监控能力,您可以通过拓扑展示Mobile或Browser侧到数据中心的时延和吞吐数据,也可以通过端侧分析获取应用体验、吞吐量、错误数、卡顿&崩溃分析、地理位置分布等应用性能监控数据,实时了解应用的运行状态,快速诊断故障。

优势

E2E全链路追踪:通过分布式调用链追踪技术还原问题现场,快速定位代码性能瓶颈。

RCA智能根因分析:对运维数据智能实时分析,识别成功和异常的规律,从而找出问题根因。

零编码接入:APP侧采用非侵入式埋点技术,无需使用SDK方式埋点,APP快速接入。

运维指标智能分析

海量业务下,出现百种指标监控、KPI数据、调用跟踪数据等丰富但无关联的运维数据,如何通过应用、服务、实例、主机和事务等多视角分析关联指标和告警数据,自动完成故障根因分析;如何基于历史数据学习与运维经验库,对异常进行智能分析并给出可能原因。

AOM通过AI智能算法分析各类运维指标趋势变化,提前预测潜在异常,包括指标的增幅过高、规律变化等。

优势

场景智能识别:根据运维指标特征选择算法匹配,如状态跳变、周期异常等。

自适应算法:当出现过多告警时,自动调整算法参数抑制告警。

毛刺信号自动过滤:自动过滤掉偶然出现离散的毛刺信号,避免误报。

巡检与问题定界

日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。

AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监控、 日志分析 、事件报警等功能,支持日常巡检资源、应用整体运行情况,及时发现并定界应用与资源的问题。

优势

应用自动发现:自动部署采集器,针对应用的运行环境,主动发现应用并进行监控。

云服务 的分布式应用监控:对于同时使用了多种云服务的分布式应用,提供统一的运维平台,便于您对业务进行立体排查。

事件告警灵活通知:提供多种异常检测策略并支持丰富的异常事件触发方式及API。

立体化运维

您需全方位掌控系统的运行状态,并快速响应各类问题。

AOM提供从云平台到资源,再到应用的监控和微服务调用链的立体化运维分析能力。

优势

体验保障:实时掌控业务KPI健康状态,对异常事务根因分析。

故障快速诊断:分布式调用追踪,快速找到异常故障点。

资源运行保障:实时监控容器、磁盘、网络等上百种资源运维指标集群-虚机-应用-容器异常关联分析。

上一篇:云服务器网卡配置虚拟IP地址AssociateServerVirtualIp 下一篇:入驻华为云云市场基础软件子市场的条件

应用运维管理 AOM

 

应用运维管理(Application Operations Management)是云上应用的一站式立体化运维管理平台,实时监控应用及云资源,采集各项指标、日志及事件等数据分析应用健康状态,提供告警及数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。