开通应用性能管理 APM2.0

开通APM前请先注册华为帐号并完成实名认证

步骤一、开通APM2.0。

  1. 登录华为云APM管理控制台。
  2. 单击左侧,选择“管理与监管 > 应用性能管理 APM”进入APM服务页面。
  3. 单击右上角“点击体验新版”进入APM2.0服务页面。
  4. 单击“免费体验应用监控”,开通服务。


步骤二、自动创建访问密钥。

  1. 自动创建访问密钥。
  2. APM2.0通过AK/SK进行签名验证,通过授权的帐号才能上报数据。
  3. 登录APM2.0服务控制台。
  4. 单击左侧导航栏“系统管理 > 访问密钥”,进入访问密钥页面。
  5. 在访问密钥页面查看自动创建的访问密钥。


通过应用性能管理 APM 快速管理应用

在“总览”页面的应用视角下,如何通过APM快速管理应用,包括应用快速接入、手工接入等操作。

  • 快速接入

    开始监控JAVA应用,快速接入Agent。

    开始监控JAVA应用,快速接入Agent。

  • 步骤二:进程发现

    为应用配置进程发现规则,采集器会主动上报运维数据。

    为应用配置进程发现规则,采集器会主动上报运维数据。

  • 部署在CCE容器中的JAVA应用安装Agent

    开始监控JAVA应用,为部署在CCE容器中的JAVA应用安装Agent。

    开始监控JAVA应用,为部署在CCE容器中的JAVA应用安装Agent。

  • CloudDeploy安装Agent

    开始监控JAVA应用,为CloudDeploy安装Agent。

    开始监控JAVA应用,为CloudDeploy安装Agent。

应用运维管理 APM应用场景

  • 应用异常诊断

    业务痛点

    分布式微服务架构下的应用,虽然丰富多样且开发效率高,但是给传统运维诊断技术带来了巨大挑战。以电商为例,主要遇到如下问题:

    定位问题难

    客服人员接到用户反馈商品购买出现问题后,会交由技术人员排查解决。而微服务分布式架构中的一个业务请求通常要经过多个服务/节点后返回结果。一旦请求出现错误,往往要在多台机器上反复翻看日志才能初步定位问题,对简单问题的排查也常常涉及多个团队。

    架构梳理难

    在业务逻辑变得逐渐复杂以后,很难从代码层面去梳理某个应用依赖了哪些下游服务(数据库、HTTP API、缓存),以及被哪些外部调用所依赖。业务逻辑的梳理、架构的治理和容量的规划(例如活动的准备过程中,需要为每个应用准备多少台机器)也变得更加困难。

    业务实现

    APM提供大型分布式应用异常诊断能力,当应用出现崩溃或请求失败时,通过应用拓扑+调用链下钻能力分钟级完成问题定位。

    可视化拓扑:应用拓扑自发现,异常应用实例无处躲藏。

    调用链跟踪:发现异常应用后,通过调用链一键下钻,代码问题根因清晰可见。

    慢SQL分析:提供数据库、SQL语句的调用次数、响应时间、错误次数等关键指标视图,支持异常SQL语句导致的数据库性能问题分析。


    业务痛点

    分布式微服务架构下的应用,虽然丰富多样且开发效率高,但是给传统运维诊断技术带来了巨大挑战。以电商为例,主要遇到如下问题:

    定位问题难

    客服人员接到用户反馈商品购买出现问题后,会交由技术人员排查解决。而微服务分布式架构中的一个业务请求通常要经过多个服务/节点后返回结果。一旦请求出现错误,往往要在多台机器上反复翻看日志才能初步定位问题,对简单问题的排查也常常涉及多个团队。

    架构梳理难

    在业务逻辑变得逐渐复杂以后,很难从代码层面去梳理某个应用依赖了哪些下游服务(数据库、HTTP API、缓存),以及被哪些外部调用所依赖。业务逻辑的梳理、架构的治理和容量的规划(例如活动的准备过程中,需要为每个应用准备多少台机器)也变得更加困难。

    业务实现

    APM提供大型分布式应用异常诊断能力,当应用出现崩溃或请求失败时,通过应用拓扑+调用链下钻能力分钟级完成问题定位。

    可视化拓扑:应用拓扑自发现,异常应用实例无处躲藏。

    调用链跟踪:发现异常应用后,通过调用链一键下钻,代码问题根因清晰可见。

    慢SQL分析:提供数据库、SQL语句的调用次数、响应时间、错误次数等关键指标视图,支持异常SQL语句导致的数据库性能问题分析。


  • 应用体验管理

    业务痛点

    在用户体验至上的互联网时代,即使后台业务稳定运行,仍然无法获悉用户访问系统时的具体情况,因而定位线上用户偶现的前端问题变得非常困难。一个系统上线之后,访问时的大量报错导致用户无法正常使用,如果我们无法及时获知,就会导致流失大量用户,如果用户反馈页面的使用情况,我们能否第一时间复现用户的使用场景;能否知晓用户遇到的详细报错信息而快速修复。

    业务实现

    APM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到服务器、用户请求的完整过程,实时感知用户对应用的满意度,帮助您全面了解用户体验状况。对于用户体验差的事务,通过拓扑和调用链完成事务问题定位。

    应用KPI分析:吞吐量、时延、成功率指标分析,实时掌控用户体验健康状态,用户体验一览无遗。

    全链路性能跟踪:Web服务、缓存、数据库全栈跟踪,性能瓶颈轻松掌握


    业务痛点

    在用户体验至上的互联网时代,即使后台业务稳定运行,仍然无法获悉用户访问系统时的具体情况,因而定位线上用户偶现的前端问题变得非常困难。一个系统上线之后,访问时的大量报错导致用户无法正常使用,如果我们无法及时获知,就会导致流失大量用户,如果用户反馈页面的使用情况,我们能否第一时间复现用户的使用场景;能否知晓用户遇到的详细报错信息而快速修复。

    业务实现

    APM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到服务器、用户请求的完整过程,实时感知用户对应用的满意度,帮助您全面了解用户体验状况。对于用户体验差的事务,通过拓扑和调用链完成事务问题定位。

    应用KPI分析:吞吐量、时延、成功率指标分析,实时掌控用户体验健康状态,用户体验一览无遗。

    全链路性能跟踪:Web服务、缓存、数据库全栈跟踪,性能瓶颈轻松掌握

  • 故障智能诊断

    业务痛点

    海量业务下,出现百种指标监控、KPI数据、调用跟踪数据等丰富但无关联的应用运维数据,如何通过应用、组件和URL跟踪等多视角分析关联指标和告警数据,自动完成故障根因分析;如何基于历史数据学习与运维经验库,对异常事务智能分析给出可能原因。

    业务实现

    APM提供故障智能诊断能力,基于机器学习算法自动检测应用故障。当URL跟踪出现异常时,通过智能算法学习历史指标数据,多维度关联分析异常指标,提取业务正常与异常时上下文数据特征,如资源、参数、调用结构,通过聚类分析找到问题根因。

    业务痛点

    海量业务下,出现百种指标监控、KPI数据、调用跟踪数据等丰富但无关联的应用运维数据,如何通过应用、组件和URL跟踪等多视角分析关联指标和告警数据,自动完成故障根因分析;如何基于历史数据学习与运维经验库,对异常事务智能分析给出可能原因。

    业务实现

    APM提供故障智能诊断能力,基于机器学习算法自动检测应用故障。当URL跟踪出现异常时,通过智能算法学习历史指标数据,多维度关联分析异常指标,提取业务正常与异常时上下文数据特征,如资源、参数、调用结构,通过聚类分析找到问题根因。

应用运维管理 APM常见问题解答

应用运维管理 APM常见问题解答

应用运维管理 APM帮你您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行

应用运维管理 APM帮你您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行

  • APM有哪些隐私与敏感信息保护声明?

    由于APM会将运维数据内容展示到APM控制台,请您在使用过程中,注意您的隐私及敏感信息数据保护,不建议将隐私或敏感数据上传到APM,必要时请加密保护。

  • APM产品规格差异有哪些?

    APM产品规格包括基础版和企业版,当前支持Java应用接入APM。

    基础版

    版本说明:完全免费,最多可接入10个Agent在线,每过15天需要用户重新激活。

    数据存储时长:7天。

    支持功能:应用拓扑、调用链、跨Region调用链跟踪、指标监控、URL跟踪分析、告警、MDB。

    企业版

    版本说明:所有功能完全开放。

    数据存储时长:30天。

    支持功能:应用拓扑、调用链、跨Region调用链跟踪、指标监控、URL跟踪分析、告警、MDB。

  • APM 1.0版本跟APM 2.0版本有什么区别?

    APM2.0相比原APM1.0,增加监控指标数量、增加监控中间件数量,提高端到端调用链路完整性,并且进一步优化了业务保护、数据采样和安全隐私。

  • APM数据采集有哪些限制?

    在使用APM服务过程中用户开启APM数据采集开关后,APM仅采集应用性能指标及调用链相关数据,不涉及个人隐私数据。所采集的数据仅用于应用的性能分析和故障诊断,不会用于其他商业目的。

    详细内容参见数据采集