检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过多账号聚合Prometheus实例实现指标数据统一监控 本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 应用场景 某电商平台运维人员在监控指标时,只能实时监控一个账号下的指标数据,无法同时监控其他账号。 解决方案 AOM通过Prometheus监控功能,创建多
监控安全风险 AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。
监控安全风险 AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、工作负载监控、集群监控、主机监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。
概览 url调用次数 URL的调用次数。 url平均响应时间 URL在采集周期内的平均响应时间。 url错误率 URL的错误率。 mysql错误率 MySQL的错误率。 redis错误率 Redis的错误率。 httpclient调用次数 HttpClient的调用次数。 httpclient平均响应时间
累计触发:某个监控周期内,事件或者告警满足筛选条件的次数达到设置的累计次数,按照设置的频率发送对应的告警通知。频率设置为N/A时,无通知次数限制,即事件或者告警满足筛选条件的次数达到设置的累计次数就会发送一次通知。 例如,设置事件名称为“数据卷扩容失败”,监控周期为“20分钟”,累计次数为“>=3”,频率为“
再发送通知,避免产生告警风暴。 应用场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过多,无法及时从众多告警中及时发现故障,全面掌握应用情况。 解决方案 下面以监控ELB业务层全量指标为例说明,如何使用分组规则清除告警风暴。
触发告警级别包括“紧急”、“重要”、“次要”、“提示”,默认“紧急”。 统计周期指高级设置的统计周期;满足条件指设置的条件表达式。配置的统计周期次数须大于等于满足触发条件次数。统计周期次数最小值为1,最大值为10。 单击+增加条件表达式(or),最多支持增加20条。 单击删除条件表达式。 条件表达式支持的基础语法和多表组合语法。
Websocket监控参数说明列表 指标集 参数 说明 详情 url websocket对应的url 调用次数 消息处理方法调用次数 平均响应时间(ms) 平均响应时间(ms) 错误次数 消息处理错误次数 最慢调用(ms) 最大响应时间 创建连接数 创建连接数 关闭连接数 关闭连接数 关闭原因 连接关闭的原因
活跃的实例/总实例数。分数下的内容分别表示在当前所选的时间内服务被调用次数、响应时延、错误数。每个箭头连线代表一个调用关系。调用次数越多,连线越粗。连线上的数据表示吞吐量和整体时延。吞吐量即所选时间的调用次数。拓扑使用Apdex对应用性能满意度进行量化,并使用不同颜色对不同区间A
AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持将应用层组件的调用链接入APM,来监控应用相关的性能图表或接口性能指标等。例如:请求平均时延、错误调用次数、请求吞吐量等。 配置应用层接入AOM 登录AOM 2.0控制台。 在左侧导航栏中选择“接入 > 接入中心”,进入接入中心页面。(如果您进
技术栈”筛选出需要查看的组件。 在组件列表中查看url调用次数、url平均响应时间、url错误率、mysql错误率等性能指标。 图1 组件列表指标 表1 组件列表指标说明 指标名称 说明 url调用次数 URL的调用次数。 url平均响应时间 URL在采集周期内的平均响应时间。 url错误率
每个协议和数据流的缓存命中次数 coredns_forward_conn_cache_misses_total 每个协议和数据流的缓存未命中次数 coredns_forward_healthcheck_broken_total 健康检查broken次数 coredns_forwa
erflow 驱逐达到最大驱逐阈值的次数 主机因请求异常率达到最大驱逐比例而被限制驱逐的次数。 ≥0 次 envoy_cluster_ejections_consecutive_5xx 连续5xx 驱逐次数 主机因连续返回5xx导致的驱逐次数。 ≥0 次 envoy_cluste
数据保护技术 AOM通过多种数据保护手段和特性,保障AOM的数据安全可靠。 表1 AOM的数据保护手段和特性 数据保护手段 简要说明 详细介绍 传输加密(HTTPS) AOM支持HTTPS传输协议,保证数据传输的安全性。 构造请求 数据冗余存储 指标、告警、配置等数据以多副本方式存储,保障数据可靠性。
异常日志参数说明列表 指标集 参数 说明 异常 类名 发生异常的所在类。 异常类型 该异常的类型。 日志类型 该异常打印所属的日志类型。 次数 异常发生的次数。 异常消息 该异常产生的异常消息。 异常堆栈 该异常产生的异常堆栈。 调用链 该异常对应的调用链信息。 日志版本 日志类型 日志类型。
总览”。 登录APM控制台。 在左侧导航栏选择“App监控 > 总览”。 总览 崩溃 崩溃页面展示App监控的“崩溃”信息,包括该应用下的总崩溃次数、设备崩溃率、影响设备数、影响版本数、崩溃总览趋势图、TOP5版本崩溃、TOP5设备崩溃以及崩溃列表。 登录AOM 2.0控制台。 在左侧导航栏选择“App监控
MQTT消息上报成功次数 统计当前实例/资源空间下MQTT消息上报成功次数 ≥0 次 iotda_south_messageUp_failedCount MQTT消息上报失败次数 统计当前实例/资源空间下MQTT消息上报失败次数 ≥0 次 AMQP流转次数 iotda_amqp
数据保护技术 AOM通过多种数据保护手段和特性,保障AOM的数据安全可靠。 表1 AOM的数据保护手段和特性 数据保护手段 简要说明 详细介绍 传输加密(HTTPS) AOM支持HTTPS传输协议,保证数据传输的安全性。 构造请求 数据冗余存储 指标、告警、配置等数据以多副本方式存储,保障数据可靠性。
报量、指标存储时长、数据转储量计费。先使用,后付费。 按需计费模式允许您根据实际业务需求灵活地调整资源使用,无需提前预置资源,从而降低预置过多或不足的风险。 父主题: 计费模式
M_GarbageCollector_ConcurrentMarkSweep_Count JobManager CMS垃圾回收器的回收次数。 次数 flink_jobmanager_Status_JVM_GarbageCollector_ConcurrentMarkSweep_Time