检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
入门实践 当您了解如何使用APM监控应用后,可以根据自身的业务需求,使用应用性能管理 APM提供的一系列常用实践。 本文介绍应用性能管理 APM常用实践,帮助您更好地使用应用性能管理。 表1 常用最佳实践 实践 描述 定位请求异常原因 应用日常巡检,监控应用时延、吞吐量、错误数等性能指标。
服务器的时区、时间都一致。否则,可能会导致安装后不能在界面上准确查看应用的拓扑、调用链等数据。 安装方式说明 ICAgent有两种安装方式,您可以按照您的场景进行选择。您需要注意的是,下述两种安装方式,都不适用于容器节点(通过ServiceStage、AOS、CCE创建的集群容器
sql对应的唯一id,用于告警配置 - ENUM LAST concurrentMax 最大并发 该sql的最大并发 - INT MAX errorCount 错误次数 该sql的错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid
currentThreadsBusyMax 最大繁忙线程数 该端口在采集周期内的最大繁忙线程数 - INT MAX maxThreads 最大线程数 该端口的最大线程数 - INT MAX maxConnections 最大连接数 该端口的最大连接数 - INT MAX connectionCount
sql对应的唯一id,用于告警配置 - ENUM LAST concurrentMax 最大并发 该sql的最大并发 - INT MAX errorCount 错误次数 该sql的错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid
sql对应的唯一id,用于告警配置 - ENUM LAST concurrentMax 最大并发 该sql的最大并发 - INT MAX errorCount 错误次数 该sql的错误次数 - INT SUM errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid
Lettuce客户端 介绍APM采集的Lettuce客户端指标的类别、名称、含义等信息。 表1 Lettuce客户端指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 客户端信息(clientInfo,客户端信息指标集。) version version 客户端版本
KafkaProducer监控 介绍APM采集的KafkaProducer监控指标的类别、名称、含义等信息。 表1 KafkaProducer监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 topic (topic,kafka的topic监控数据。) id id
NodeJs状态监控 介绍APM采集的NodeJs状态监控指标的类别、名称、含义等信息。 表1 NodeJs状态监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 cpu total cpu整体使用率 cpu整体使用率 - DOUBLE AVG sys
应用拓扑主要分两种: 单组件拓扑:是单个组件下的单个环境的拓扑,同时可以展开直接或间接上下游的组件的拓扑关系。 全局应用拓扑:可以查看这个应用下面全部或者部分组件的全局拓扑关系。 URL跟踪 通过URL跟踪可以让用户跟踪某一些重要接口调用与下游的服务调用关系,从更细粒度角度发现问题。 资源标签管理
部署APM Agent时,必须确保接入APM的机器与APM服务网络连通,Agent才能正常工作。 可使用Telnet命令测试目标机器与APM服务器网络是否连通。例如,以检查华北-北京四区域,且接入方式选择“增强型探针”的连通性为例,请登录应用所部署的机器,并输入命令telnet 100.125
应用码的值与业务code的正确值相同。配置url监控项详见配置url监控项。 选填 查看调用链详情 根据搜索条件查询出来的调用链列表可以查看调用链的基本信息 在查询后的调用链列表中,单击待查看的调用链前的,查看该调用链基本信息,如下图所示。 图2 调用链基本信息 表中标识的具体参数所代表的含义如下:
资源标签管理 通过给账户下资源添加标签,可以对资源进行自定义标记,实现资源的分类。本章节指导您如何利用标签对资源进行查询,及如何对资源进行标签的编辑、修改、删除等。 资源标签管理相关联服务标签管理服务、激活成本标签、费用中心。 查看资源标签 登录管理控制台。 单击左侧,选择“管理与监管
定位事务异常原因 本文介绍使用事务定位应用异常。事务的主要功能是对应用服务端业务流的实时分析,通过Apdex直观体现用户对应用的满意度。您可以用通过满意度情况定位应用异常或者性能瓶颈问题。 在使用APM管理电商应用最佳实践中,我们已经将APM接入了应用,本节我们继续以该应用为例,介绍如何使用事务功能定位问题。
主机名称 主机名称。 IP 实例的IP地址。 实例名称 实例名称。 采集器 采集器名称。 单击“采集器”列的,支持按照采集器名称过滤。 状态 采集状态,包括:正常、采集错误以及未开始。 单击“状态”列的,支持按照状态过滤。 最后采集时间 采集器最后采集数据的时间。 父主题: 应用指标监控
异常(exception,Druid调用的异常信息统计。) exceptionType 异常类型 异常类型 - ENUM LAST causeType 异常类 发生异常的类 - ENUM LAST count 次数 该异常的发生次数 - INT SUM message 异常消息 该异常产生的异常消息 - STRING
DubboProvider监控 介绍APM采集的dubbo服务端监控指标的类别、名称、含义等信息。 表1 DubboProvider采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 invocationDetail radio
SUM maxTime 最大响应时间 集群被调用的最大响应时间 ms INT MAX totalTime 总响应时间 集群被调用的总响应时间 ms INT SUM CSEConsumer调用详情(detail,以被调用的接口为维度统计的接口调用详情。) qualifiedName 调用url
causeType 异常类 发生异常的类 - ENUM LAST count 次数 该异常的发生次数 - INT SUM message 异常消息 该异常产生的异常消息 - STRING LAST stackTrace 异常堆栈 该异常产生的堆栈信息 - CLOB LAST ex
method method 请求的方法 - ENUM LAST concurrentMax 最大并发 该方法的最大并发 - INT MAX errorCount 错误数 该方法的错误数 - INT SUM invokeCount 调用次数 该方法的调用次数 - INT SUM maxTime