通过应用性能管理 APM 快速管理应用
在“总览”页面的应用视角下,如何通过APM快速管理应用,包括应用快速接入、手工接入等操作。
应用运维管理 APM应用场景
-
业务痛点
分布式微服务架构下的应用,虽然丰富多样且开发效率高,但是给传统运维诊断技术带来了巨大挑战。以电商为例,主要遇到如下问题:
定位问题难
客服人员接到用户反馈商品购买出现问题后,会交由技术人员排查解决。而微服务分布式架构中的一个业务请求通常要经过多个服务/节点后返回结果。一旦请求出现错误,往往要在多台机器上反复翻看日志才能初步定位问题,对简单问题的排查也常常涉及多个团队。
架构梳理难
在业务逻辑变得逐渐复杂以后,很难从代码层面去梳理某个应用依赖了哪些下游服务(数据库、HTTP API、缓存),以及被哪些外部调用所依赖。业务逻辑的梳理、架构的治理和容量的规划(例如活动的准备过程中,需要为每个应用准备多少台机器)也变得更加困难。
业务实现
APM提供大型分布式应用异常诊断能力,当应用出现崩溃或请求失败时,通过应用拓扑+调用链下钻能力分钟级完成问题定位。
可视化拓扑:应用拓扑自发现,异常应用实例无处躲藏。
调用链跟踪:发现异常应用后,通过调用链一键下钻,代码问题根因清晰可见。
慢SQL分析:提供数据库、SQL语句的调用次数、响应时间、错误次数等关键指标视图,支持异常SQL语句导致的数据库性能问题分析。
业务痛点
分布式微服务架构下的应用,虽然丰富多样且开发效率高,但是给传统运维诊断技术带来了巨大挑战。以电商为例,主要遇到如下问题:
定位问题难
客服人员接到用户反馈商品购买出现问题后,会交由技术人员排查解决。而微服务分布式架构中的一个业务请求通常要经过多个服务/节点后返回结果。一旦请求出现错误,往往要在多台机器上反复翻看日志才能初步定位问题,对简单问题的排查也常常涉及多个团队。
架构梳理难
在业务逻辑变得逐渐复杂以后,很难从代码层面去梳理某个应用依赖了哪些下游服务(数据库、HTTP API、缓存),以及被哪些外部调用所依赖。业务逻辑的梳理、架构的治理和容量的规划(例如活动的准备过程中,需要为每个应用准备多少台机器)也变得更加困难。
业务实现
APM提供大型分布式应用异常诊断能力,当应用出现崩溃或请求失败时,通过应用拓扑+调用链下钻能力分钟级完成问题定位。
可视化拓扑:应用拓扑自发现,异常应用实例无处躲藏。
调用链跟踪:发现异常应用后,通过调用链一键下钻,代码问题根因清晰可见。
慢SQL分析:提供数据库、SQL语句的调用次数、响应时间、错误次数等关键指标视图,支持异常SQL语句导致的数据库性能问题分析。
-
业务痛点
在用户体验至上的互联网时代,即使后台业务稳定运行,仍然无法获悉用户访问系统时的具体情况,因而定位线上用户偶现的前端问题变得非常困难。一个系统上线之后,访问时的大量报错导致用户无法正常使用,如果我们无法及时获知,就会导致流失大量用户,如果用户反馈页面的使用情况,我们能否第一时间复现用户的使用场景;能否知晓用户遇到的详细报错信息而快速修复。
业务实现
APM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到服务器、用户请求的完整过程,实时感知用户对应用的满意度,帮助您全面了解用户体验状况。对于用户体验差的事务,通过拓扑和调用链完成事务问题定位。
应用KPI分析:吞吐量、时延、成功率指标分析,实时掌控用户体验健康状态,用户体验一览无遗。
全链路性能跟踪:Web服务、缓存、数据库全栈跟踪,性能瓶颈轻松掌握
业务痛点
在用户体验至上的互联网时代,即使后台业务稳定运行,仍然无法获悉用户访问系统时的具体情况,因而定位线上用户偶现的前端问题变得非常困难。一个系统上线之后,访问时的大量报错导致用户无法正常使用,如果我们无法及时获知,就会导致流失大量用户,如果用户反馈页面的使用情况,我们能否第一时间复现用户的使用场景;能否知晓用户遇到的详细报错信息而快速修复。
业务实现
APM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到服务器、用户请求的完整过程,实时感知用户对应用的满意度,帮助您全面了解用户体验状况。对于用户体验差的事务,通过拓扑和调用链完成事务问题定位。
应用KPI分析:吞吐量、时延、成功率指标分析,实时掌控用户体验健康状态,用户体验一览无遗。
全链路性能跟踪:Web服务、缓存、数据库全栈跟踪,性能瓶颈轻松掌握
-
业务痛点
海量业务下,出现百种指标监控、KPI数据、调用跟踪数据等丰富但无关联的应用运维数据,如何通过应用、组件和URL跟踪等多视角分析关联指标和告警数据,自动完成故障根因分析;如何基于历史数据学习与运维经验库,对异常事务智能分析给出可能原因。
业务实现
APM提供故障智能诊断能力,基于机器学习算法自动检测应用故障。当URL跟踪出现异常时,通过智能算法学习历史指标数据,多维度关联分析异常指标,提取业务正常与异常时上下文数据特征,如资源、参数、调用结构,通过聚类分析找到问题根因。
业务痛点
海量业务下,出现百种指标监控、KPI数据、调用跟踪数据等丰富但无关联的应用运维数据,如何通过应用、组件和URL跟踪等多视角分析关联指标和告警数据,自动完成故障根因分析;如何基于历史数据学习与运维经验库,对异常事务智能分析给出可能原因。
业务实现
APM提供故障智能诊断能力,基于机器学习算法自动检测应用故障。当URL跟踪出现异常时,通过智能算法学习历史指标数据,多维度关联分析异常指标,提取业务正常与异常时上下文数据特征,如资源、参数、调用结构,通过聚类分析找到问题根因。
应用运维管理 APM常见问题解答
应用运维管理 APM常见问题解答
应用运维管理 APM帮你您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行
应用运维管理 APM帮你您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行