检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障智能诊断 业务痛点 海量业务下,出现百种指标监控、KPI数据、调用跟踪数据等丰富但无关联的应用运维数据,如何通过应用、组件和URL跟踪等多视角分析关联指标和告警数据,自动完成故障根因分析;如何基于历史数据学习与运维经验库,对异常事务智能分析给出可能原因。 业务实现 APM提供故障
环境标签列表,可为空。 direction 否 String 方向,可为空。 end_time 是 String 结束时间。 start_time 是 String 开始时间。 filter_user 否 Boolean 过滤。 响应参数 状态码: 200 表3 响应Body参数 参数
次发生时间、最后发生时间以及操作。 图5 错误列表 表5 错误列表相关参数说明 参数名称 说明 错误摘要 错误信息的摘要。 错误类型 错误的类型。 错误次数 错误的次数。 影响设备数 错误影响设备的数量。 影响版本数 错误影响版本的次数。 首次发生时间 错误首次发生的时间。 最后发生时间
> 账单管理 > 流水和明细账单 > 流水账单”中,查看计费模式为“按需”的“应用性能管理 APM”产品的“消费时间”,即实际使用时间。 查看流水和明细账单 登录华为云控制台。 选择“费用与成本 > 费用账单 > 账单管理 >流水和明细账单”,进入“流水和明细账单”页面。 在“流
Long 环境id。 direction 否 String 方向,可为空。 end_time 是 String 结束时间。 start_time 是 String 开始时间。 filter_user 否 Boolean 过滤。 响应参数 状态码: 200 表3 响应Body参数 参数
故障智能诊断 业务痛点 海量业务下,出现百种指标监控、KPI数据、调用跟踪数据等丰富但无关联的应用运维数据,如何通过应用、服务、实例、主机和事务等多视角分析关联指标和告警数据,自动完成故障根因分析;如何基于历史数据学习与运维经验库,对异常事务智能分析给出可能原因。 业务实现 APM提供故障智
首次发生时间、最后发生时间以及操作。 图5 卡顿列表 表5 卡顿列表相关参数说明 参数名称 说明 卡顿摘要 卡顿信息的摘要。 卡顿类型 卡顿的类型。 卡顿次数 卡顿的次数。 影响设备数 卡顿影响设备数量。 影响版本数 卡顿影响版本数量。 首次发生时间 首次发生卡顿的时间。 最后发生时间
n Performance Management,简称APM)是实时监控并管理云应用性能和故障的云服务,提供专业的分布式应用性能分析能力,可以帮助运维人员快速解决应用在分布式架构下的问题定位和性能瓶颈等难题,为用户体验保驾护航。 APM作为云应用诊断服务,拥有强大的分析工具,通过
APM控制台的“全局配置(系统管理 > 通用配置)”中字节码方式采集被停止。 如果长时间未采集到指标数据,可能的原因有: java9启动提示找不到sql.time类 原因分析:APM探针开发环境为jdk1.7,而java 9模块化后,sql包不会默认提供,需要应用引入模块。 出现概率:有条件出现。
概览 概览是对组件所有实例的数据进行汇总,监控数据包括总请求量、平均响应时间、接口错误率、慢调用、慢SQL、异常数量。慢调用展示最大耗时的五条数据、错误调用展示错误次数最多的五条数据、慢sql展示最大耗时的五条数据,异常展示总次数最多的五条数据。 登录管理控制台。 单击左侧,选择“管理与监管>
基础监控页签。 图1 基础监控 在基础监控页签选择您想要查看的“实例名称”,可以查看该实例的应用监控数据。 gc 对gc进行监控,展示gc时间以及gc次数指标的趋势图。 cpu 对cpu进行监控,展示cpu使用率的趋势图。 线程 对线程进行监控,展示BLOCKED状态线程数、峰值
10-100ms 响应时间在10-100ms范围请求数。 100-500ms 响应时间在100-500ms范围请求数。 500-1000ms 响应时间在500-1000ms范围请求数。 1-10s 响应时间在1-10s范围请求数。 10s以上 响应时间在10s以上请求数。 异常信息
标签 用户自定义标签,可作为搜索的关键字。 加载次数 页面加载的次数。 平均加载时间 页面平均加载时间。 平均首屏时间 页面平均首屏时间。 平均白屏时间 页面平均白屏时间。 平均交互时间 页面平均交互时间。 单击“会话ID”列中的某一条会话ID,展示该用户轨迹详情,详见访问追踪-步骤2。
色字体数值,可以查看所选时间段内该Web容器的趋势图。 单击“版本”列的版本信息,可以查看对应版本详情。 在Web容器页签选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 图2 选择实例和监控项 单击时间维度选择按钮,默认“近20分钟”。
探针统计 APM支持对租户使用的探针数量进行统计,您可以从多个维度(时间、区域、探针类型)查看租户使用的探针数量。 登录管理控制台。 单击左侧,选择“管理与监管 > 应用性能管理 APM”,进入APM服务页面。 在左侧导航栏选择“系统管理 > 探针统计”,进入当前探针页面。 图1
新增绘制延迟指标采集,默认关闭,通过enableInp参数开关控制。 1.0.47 新增pvid和ssid字段上报,用于会话追踪和流量分析。 1.0.46 新增自定义标签uid和tag,新增__rum.setUid和__rum.setTag方法。 操作步骤 进入前端监控页面,单击“接入前端站点”。
图2 类名及方法 图3 方法分析详情 页面左侧展示该方法的执行记录,包括:耗时明细、调用来源以及方法源码。 耗时明细展示调用方法,耗时时间,“下钻”操作。 单击“下钻”展示某个调用方法的详细信息。 图4 下钻 页面右侧展示默认观测项目,包括:Parameters、Return
告警通知 告警可帮您将组件的告警以短信、邮件、函数、语音或工作流的方式发送给您指定的终端,以便在第一时间获取到组件的异常状况,进而迅速处理故障,避免造成业务损失。前提是有消息通知服务(Simple Message Notification,简称SMN)的权限,具体配置请参见权限管理。
、超限阈值)发生变化时,会以邮件或短信等方式通知,以便您在第一时间发现异常并进行处理。 创建方式 阈值规则支持创建批量阈值规则,供您选择使用。 批量阈值规则(该功能仅对华北-北京一区域和华东-上海二区域生效):资源和规则是多对一的关系,当监控多个资源时,一次创建操作完成后,只生成
的堆内存大小或者已分配但未被回收的堆内存大小。以CPU占用时长为例,占用的CPU时间越长,在火焰图X轴上的距离越长。 在火焰图中,相同的方法或包显示的颜色相同。 鼠标放在火焰图上,展示某一个方法、类和线程的详细信息。 单击火焰图中某个方法条,该方法条横向放大。单击首列“Total”列标题行,火焰图还原。