检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
何通过应用、组件和URL跟踪等多视角分析关联指标和告警数据,自动完成故障根因分析;如何基于历史数据学习与运维经验库,对异常事务智能分析给出可能原因。 业务实现 APM提供故障智能诊断能力,基于机器学习算法自动检测应用故障。当URL跟踪出现异常时,通过智能算法学习历史指标数据,多维
应用、服务、实例、主机和事务等多视角分析关联指标和告警数据,自动完成故障根因分析;如何基于历史数据学习与运维经验库,对异常事务智能分析给出可能原因。 业务实现 APM提供故障智能诊断能力,基于机器学习算法自动检测应用故障。当事务出现异常时,通过智能算法学习历史指标数据,多维度关联
n Performance Management,简称APM)是实时监控并管理云应用性能和故障的云服务,提供专业的分布式应用性能分析能力,可以帮助运维人员快速解决应用在分布式架构下的问题定位和性能瓶颈等难题,为用户体验保驾护航。 APM作为云应用诊断服务,拥有强大的分析工具,通过
APM支持各业务下的环境及应用进行标签管理,按照业务需求对不同的环境及应用添加对应的标签,用来划分业务,方便对业务进行管理。 标签管理包括两部分:标签和全局标签。 标签是对某个应用下一个或者多个环境的监控项对应的某个采集器,自定义采集参数。 全局标签是对某个应用下所有环境的监控项对应的某个采集器,自定义采集参数。
常用诊断场景的指标下钻分析 根据应用响应时间、请求数、错误率等指标下钻分析,按应用、组件、环境、数据库和中间件等多维度查看。 异常URL跟踪和慢URL跟踪捕捉 基于调用URL跟踪的超时和异常分析,并有效自动关联到对应的接口调用,如 SQL、MQ 等。 前端监控 APM Agent会周
什么是Apdex和Apdex阈值? Apdex全称是Application Performance Index,是由Apdex联盟开发的用于评估应用性能的工业标准。Apdex标准从用户的角度出发,将对应用响应时间的表现,转为用户对于应用性能的可量化范围为0-1的满意度评价。 Apdex的原理
绿色“请求成功”按钮和红色“请求失败”按钮,不支持同时置灰。 用户也可以从一些监控项视图页面,比如Url监控项的table视图,单击具体的Url跳转过来,这样就已经预先填写好搜索条件,帮助用户更快速搜索出所需要的调用链信息。 调用链详情页面可以查看调用链的完整链路信息,包含本地方法堆栈和相关远程调用的调用关系
说明 探针休眠 探针休眠产生的告警。 采集器安装告警 包括ICAgent安装失败告警、ICAgent升级失败告警、ICAgent卸载失败告警和ICAgent状态异常告警。 阈值告警 阈值规则产生的阈值告警。 更多告警类型正在开发中。 创建通知规则 登录应用性能管理。 在左侧导航栏中选择“告警中心
Istio网格集群应用接入APM。 2019-3-15 JVM监控功能增强,支持阈值规则和统计方式。 2019-3-6 全链路拓扑功能增强,完善服务、实例的指标数据,展示拓扑详情。 2018-12-26 JVM内存和线程指标监控,图表展示JVM堆内存和非堆内存,以及线程状态指标,可以快速发现内存泄漏、线程挂死等异常。
APM提供按需计费和特惠包两种方式。支持按需计费和特惠包叠加的计费方式,即如果您购买了特惠包,则先扣除特惠包内的探针实例,超出部分按需计费。 价格说明 价格详情 快速开通 开通APM 04 使用 使用APM可以帮助运维人员快速解决应用在分布式架构下的问题定位和性能瓶颈等难题。 应用监控
开通和购买 APM 1.0正在日落,目前仅新加坡以及莫斯科二,支持APM 1.0版本。 建议使用APM 2.0版本。 首次使用,请先开通APM。开通后默认使用基础版,基础版免费但功能受限使用,适用于体验场景。您可根据自己的业务需求切换版本及购买套餐包,包括探针型产品专业版、企业版
常用诊断场景的指标下钻分析:根据应用响应时间、请求数、错误率等指标下钻分析,按业务、应用、环境、数据库和中间件等多维度查看。 异常事务和慢事务捕捉:基于调用事务(Transaction)的超时和异常分析,并有效自动关联到对应的接口调用,如 SQL、MQ 等。 发布区域:以控制台实际上线区域为准
全方位的监控,可视化地还原业务请求在分布式系统中的执行轨迹和状态,用于性能及故障快速定界。 性能瓶颈定界 登录应用性能管理。 在左侧导航栏中选择“调用追踪 > 调用链”。 在调用链界面右上边,分别在“最近时间”、“应用”和“全部服务”的下拉列表框中选择需要查询的时间范围、应用名称
如何区分告警和事件? 告警和事件的相同点 在APM中告警和事件都是指APM自身在某种状态发生变化后上报给APM的信息。 告警和事件的区别 告警是APM自身在异常情况或者在可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于APM自身的功能异常而引起业务的异常。
M仅采集应用的业务调用链数据、资源信息、资源属性、内存检测信息、调用请求的KPI数据,不涉及个人隐私数据。所采集的数据仅用于APM性能分析和故障诊断,不会用于其他商业目的。 数据类型 采集数据 传输方式 存储方式 数据用途 时限 调用链数据 调用链Span数据 通过https加密结合AKSK鉴权的方式传输
实例tier。 在APM的SQL分析页面,根据查询到的tier和时间选择查询范围,查询到对应数据库实例当前时间内的SQL语句列表。 用查询到的sqlId搜索,查询到具体的SQL语句。 查询到SQL语句后,根据业务场景和SQL语句的指标值进行分析。
APM仅采集应用的业务调用链数据、资源信息、资源属性、内存检测信息、调用请求的KPI数据,不涉及个人隐私数据。所采集的数据仅用于APM性能分析和故障诊断,不会用于其他商业目的。下表为数据采集范围和用途。 数据类型 采集数据 传输方式 存储方式 数据用途 时限 调用链数据 调用链Span数据 通过https加密结合AKSK鉴权的方式传输
截方法配置参数。 采集间隔:默认60s,此处不支持修改。 拦截方法配置:是通过该配置可以采集对应的业务方法,在JavaMethod指标页面和调用链中会展示对应的方法数据。 拦截类名:配置需要采集的全限定类名(包名+类名)。 拦截方法名:配置需要采集的方法名,同一个类的多个方法以逗号分隔,如testMethod1
必填 组件 调用链所在组件。 选填 环境 调用链所在环境。 选填 实例 调用链所在实例。 选填 URL 调用链的URL,分为Rest URL和Real URL两种搜索条件:Rest URL为restful风格的URL,URL中带有变量名称,如/apm/get/{id};Real URL为实际访问的URL。
本文汇总了应用运维管理(APM,Application Performance Management)常见应用场景的操作实践,为每个实践提供详细的方案描述和操作指导,帮助用户轻松使用APM。 表1 APM 最佳实践一览表 最佳实践 说明 定位请求异常原因 在外部请求激增、负载突变等场景下,极易出