检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何区分告警和事件? 告警和事件的相同点 在APM中告警和事件都是指APM自身在某种状态发生变化后上报给APM的信息。 告警和事件的区别 告警是APM自身在异常情况或者在可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于APM自身的功能异常而引起业务的异常。 事
、环境、数据库和中间件等多维度查看。 异常URL跟踪和慢URL跟踪捕捉 基于调用URL跟踪的超时和异常分析,并有效自动关联到对应的接口调用,如 SQL、MQ 等。 前端监控 APM Agent会周期性采集一些前端监控的性能指标数据,用来衡量浏览器/H5端、小程序端的总体健康状况。
“应用”和“全部服务”的下拉列表框中选择需要查询的时间范围、应用名称和服务名称,单击“搜索”,查询相应的调用链。 (可选)在调用链界面中,单击右上角高级搜索,设置查询条件,单击“搜索”,查询相应的调用链。 根据总调用耗时锁定耗时较长的方法,找出性能瓶颈。 单击“操作”列的“查看调用关系”。
据库、HTTP API、缓存),以及被哪些外部调用所依赖。业务逻辑的梳理、架构的治理和容量的规划(例如:某活动的准备过程中,需要为每个应用准备多少台机器)也变得更加困难。 业务实现 APM提供大型分布式应用异常诊断能力,当应用出现崩溃或请求失败时,通过应用拓扑+调用链下钻能力分钟级完成问题定位。
数据库、HTTP API、缓存),以及被哪些外部调用所依赖。业务逻辑的梳理、架构的治理和容量的规划(例如促销活动的准备过程中,需要为每个应用准备多少台机器)也变得更加困难。 业务实现 APM提供大型分布式应用异常诊断能力,当应用出现崩溃或请求失败时,通过应用拓扑+调用链下钻能力分钟级完成问题定位。
实时监控并管理云应用性能和故障的云服务,提供专业的分布式应用性能分析能力,可以帮助运维人员快速解决应用在分布式架构下的问题定位和性能瓶颈等难题,为用户体验保驾护航。 您可以使用本文档提供API对应用性能管理进行相关操作,如查询应用列表。在调用应用性能管理的API之前,请确保已经充分了解应用性能管理的相关概念与功能。
概述 链路追踪采集分布式应用的完整调用链路,提供了接口调用、数据库、异常等数据采集类型。可以帮助开发者快速分析和诊断分布式应用架构下的性能瓶颈,提高微服务时代下的开发诊断效率。 安装探针是使用链路追踪功能的前提,详细操作参见探针接入。 父主题: 链路追踪
APM提供按需计费和特惠包两种方式。支持按需计费和特惠包叠加的计费方式,即如果您购买了特惠包,则先扣除特惠包内的探针实例,超出部分按需计费。 价格说明 价格详情 快速开通 开通APM 04 使用 使用APM可以帮助运维人员快速解决应用在分布式架构下的问题定位和性能瓶颈等难题。 应用监控
Management)常见应用场景的操作实践,为每个实践提供详细的方案描述和操作指导,帮助用户轻松使用APM。 表1 APM 最佳实践一览表 最佳实践 说明 定位请求异常原因 在外部请求激增、负载突变等场景下,极易出现应用性能问题。APM作为云应用性能问题诊断服务,拥有强大的分析工具,通过拓扑图
云应用性能和故障的云服务,提供专业的分布式应用性能分析能力,可以帮助运维人员快速解决应用在分布式架构下的问题定位和性能瓶颈等难题,为用户体验保驾护航。 APM作为云应用诊断服务,拥有强大的分析工具,通过拓扑图、调用链、事务分析可视化地展现应用状态、调用过程、用户对应用的各种操作,快速定位问题和改善性能瓶颈。
、异常信息、分布式追踪等,帮助开发和运维团队实时监控和优化系统性能。探针集成不可避免地引入了一定量的性能损耗,通过评估探针对Java应用的性能开销(如CPU、内存、延迟),高负载场景下的稳定性和数据采集完整性,可以确保探针在生产环境中运行可靠,性能影响可控,为优化和部署提供重要依据。
使用方法 配置url监控项的业务code采集长度限制、解析业务code的key、业务code的正确值参数。具体方法参见配置url监控项。 图6 url监控项 在左侧导航栏选择“应用监控 > 调用链”,进入调用链界面。 单击,查看对应的业务code的值。业务code的值即“应用码”。 图7
应用拓扑自动发现:通过对RPC调用信息进行动态分析、智能计算,自动生成分布式应用间拓扑关系。 调用链的自动跟踪:多个应用接入APM后,自动针对某一些请求进行采样,采集单个请求的服务之间调用关系以及中间调用的健康情况,实现全局调用链路的自动跟踪。 常用诊断场景的指标下钻分析:根据应用响应时间、请求数、错误率
本节以查询服务列表为例,详细描述接口调用的流程。该示例中的实例是在已部署的SpringCloudDemo服务上,实现调用查询服务列表接口的过程。Spring Cloud是一个基于Spring Boot实现的微服务架构开发工具。它为微服务架构中涉及的配置管理、服务治理、断路器、智能路由
APM支持当JVM内存和线程的各项指标异常时发生告警。 您可以设置实例的JVM指标阈值告警,当满足设置的告警条件时,告警会上报到告警中心。 商用 设置JVM阈值规则 2 全链路拓扑功能增强,完善服务、实例的指标数据,展示拓扑详情 拓扑是对应用间调用关系和依赖关系的可视化展示。全链路拓
对应API接口:自定义策略实际调用的API接口。 授权项:自定义策略中支持的Action,在自定义策略中的Action中写入授权项,可以实现授权项对应的权限功能。 依赖的授权项:部分Action存在对其他Action的依赖,需要将依赖的Action同时写入授权项,才能实现对应的权限功能。 IAM
定义上报等数据,帮助用户全面掌握前端应用的运行情况。 链路追踪 链路追踪采集分布式应用的完整调用链路,提供了拓扑、接口调用、数据库、异常等数据采集类型,配置告警策略,可以帮助开发者快速分析和诊断分布式应用架构下的性能瓶颈,提高微服务时代下的开发诊断效率。 App监控 APM Ag
单组件拓扑:是单个组件下的单个环境的拓扑,同时可以展开直接或间接上下游的组件的拓扑关系。 全局应用拓扑:可以查看这个应用下面全部或者部分组件的全局拓扑关系。 拓扑图展示服务之间一段时间的调用关系,可以是从调用方统计的,也可以是从被调用方统计的,并且可以查看这个调用关系的趋势图。通过拓扑图
问题现象 有时在界面中查询应用的拓扑、调用链等数据时,会查询不到或者查询到的数据明显异常,这可能是什么原因导致的呢? 时间不一致导致 应用的数据都是由采集代理ICAgent从弹性云服务器上收集并上报到浏览器界面中的。如果浏览器的时间与弹性云服务器的时区、时间不一致,则可能导致上面
什么是Apdex和Apdex阈值? Apdex全称是Application Performance Index,是由Apdex联盟开发的用于评估应用性能的工业标准。Apdex标准从用户的角度出发,将对应用响应时间的表现,转为用户对于应用性能的可量化范围为0-1的满意度评价。 Apdex的原理