检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过多账号聚合Prometheus实例实现指标数据统一监控 本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 实践场景 某电商平台运维人员在监控指标时,只能实时监控一个账号下的指标数据,无法同时监控其他账号。 解决方案 AOM通过Prometheus监控功能,创建多
Websocket监控参数说明列表 指标集 参数 说明 详情 url websocket对应的url 调用次数 消息处理方法调用次数 平均响应时间(ms) 平均响应时间(ms) 错误次数 消息处理错误次数 最慢调用(ms) 最大响应时间 创建连接数 创建连接数 关闭连接数 关闭连接数 关闭原因 连接关闭的原因
概览 url调用次数 url的调用次数。 url平均响应时间 url在采集周期内平均响应时间。 url错误率 url的错误率。 mysql错误率 sql的错误率。 redis错误率 redis的错误率。 httpclient调用次数 httpclient的调用次数。 httpclient平均响应时间
数据保护技术 AOM通过多种数据保护手段和特性,保障AOM的数据安全可靠。 表1 AOM的数据保护手段和特性 数据保护手段 简要说明 详细介绍 传输加密(HTTPS) AOM支持HTTPS传输协议,保证数据传输的安全性。 构造请求 数据冗余存储 指标、告警、配置等数据以多副本方式存储,保障数据可靠性。
数据保护技术 AOM通过多种数据保护手段和特性,保障AOM的数据安全可靠。 表1 AOM的数据保护手段和特性 数据保护手段 简要说明 详细介绍 传输加密(HTTPS) AOM支持HTTPS传输协议,保证数据传输的安全性。 构造请求 数据冗余存储 指标、告警、配置等数据以多副本方式存储,保障数据可靠性。
监控安全风险 AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。
监控安全风险 AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、工作负载监控、集群监控、主机监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。
组件列表总览 组件列表展示各个组件的指标监控项,包括:组件、环境、应用、url调用次数等信息。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”,即可在组件列表中快速筛选出需要的组件。
MQTT消息上报成功次数 统计当前实例/资源空间下MQTT消息上报成功次数 ≥0 次 iotda_south_messageUp_failedCount MQTT消息上报失败次数 统计当前实例/资源空间下MQTT消息上报失败次数 ≥0 次 AMQP流转次数 iotda_amqp
erflow 驱逐达到最大驱逐阈值的次数 主机因请求异常率达到最大驱逐比例而被限制驱逐的次数。 ≥0 次 envoy_cluster_ejections_consecutive_5xx 连续5xx 驱逐次数 主机因连续返回5xx导致的驱逐次数。 ≥0 次 envoy_cluste
报量、指标存储时长、数据转储量计费。先使用,后付费。 按需计费模式允许您根据实际业务需求灵活地调整资源使用,无需提前预置资源,从而降低预置过多或不足的风险。 父主题: 计费模式
每个协议和数据流的缓存命中次数 coredns_forward_conn_cache_misses_total 每个协议和数据流的缓存未命中次数 coredns_forward_healthcheck_broken_total 健康检查broken次数 coredns_forwa
M_GarbageCollector_ConcurrentMarkSweep_Count JobManager CMS垃圾回收器的回收次数。 次数 flink_jobmanager_Status_JVM_GarbageCollector_ConcurrentMarkSweep_Time
异常日志参数说明列表 指标集 参数 说明 异常 类名 发生异常的所在类。 异常类型 该异常的类型。 日志类型 该异常打印所属的日志类型。 次数 异常发生的次数。 异常消息 该异常产生的异常消息。 异常堆栈 该异常产生的异常堆栈。 调用链 该异常对应的调用链信息。 日志版本 日志类型 日志类型。
总览”。 登录APM控制台。 在左侧导航栏选择“App监控 > 总览”。 总览 崩溃 崩溃页面展示App监控的“崩溃”信息,包括该应用下的总崩溃次数、设备崩溃率、影响设备数、影响版本数、崩溃总览趋势图、TOP5版本崩溃、TOP5设备崩溃以及崩溃列表。 登录AOM 2.0控制台。 在左侧导航栏选择“App监控
说明: 统计周期指高级设置的统计周期;满足条件指设置的条件表达式。配置的统计周期次数须大于等于满足触发条件次数。 触发告警级别包括“紧急”、“重要”、“次要”、“提示”,默认“紧急”。 统计周期次数最小值为1,最大值为10。 高级设置 统计周期 条件表达式查询的频率可以设置为: 每小时:表示整点小时查询。
触发方式:事件类告警的触发方式。 累计触发:某个监控周期内达到累计次数则触发告警,按照设置的频率发送对应的事件告警通知。 例如,设置事件名称为“数据卷扩容失败”,监控周期为“20分钟”,累计次数为“>=3”,频率为“每5分钟”,则表示20分钟内发生数据卷扩容失败事件的次数累计达到或超过3次,则每5分钟发送一次告警通知直到告警被清除。
再发送通知,避免产生告警风暴。 实践场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过多,需要从众多告警中快速及时发现故障,全面掌握应用。 解决方案 AOM通过设置告警规则,实时监控环境中主机、组件等资源使用情况。当产品自身或
活跃的实例/总实例数。分数下的内容分别表示在当前所选的时间内服务被调用次数、响应时延、错误数。每个箭头连线代表一个调用关系。调用次数越多,连线越粗。连线上的数据表示吞吐量和整体时延。吞吐量即所选时间的调用次数。拓扑使用Apdex对应用性能满意度进行量化,并使用不同颜色对不同区间A
node_disk_written_bytes_total 写入成功的字节总数 node_disk_writes_completed_total 写入完成的次数 node_disk_write_time_seconds_total 写入花费的总时长 node_nf_conntrack_entries