检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
根据设置的频率对指标数据查询和分析结果进行检查。 固定间隔 1分钟 告警恢复 连续多少个周期不满足告警条件,恢复告警。 1 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 开启:连续周期“1”达到数据不足,状态设置“数据不足并发送告警”
S的元数据信息与鉴权信息。 1 允许 IPv4 TCP、UDP 53 100.125.0.0/16 用于DNS解析域名,下载UniAgent包时解析OBS地址、解析UniAgent服务端地址。 1 允许 IPv4 TCP 443 100.125.0.0/16 采集监控数据上报到AOM服务端。
接入管理 概述 将Prometheus的数据上报到AOM 通过grafana查看AOM中的指标数据 父主题: 配置管理
Prometheus监控 如何将Prometheus数据接入到AOM? 如何区分Prometheus监控功能采集的基础指标和自定义指标数据? 如何获取Prometheus实例的服务地址? 不能废弃以aom_prom_fixed作为前缀的指标
示。 设置完成后,监控的指标数据以折线图形式显示在告警条件上方,最多支持展示50条指标数据,单击每条指标数据前的折线符号可将对应指标数据在当前图表中隐藏。单击“新增指标”可多次添加监控指标,并为指标设置统计周期和检测规则等信息。 将光标移动到指标数据和对应告警条件后,还可以根据需要执行以下操作:
在下拉菜单中选择企业项目,仅开通企业版才会显示。 描述 应用的描述信息,最多可输入1000个字符。 接入方式默认选择“增强型探针”。 数据接入方式选择“无侵入接入”,通过接入命令接入。 图4 数据接入 表5 环境参数说明 环境变量 入参 描述 选项 APM_APP_NAME appName 组件名称,代表
1个组件状态图表最多可添加10个组件。 指标 指标数据存储时长 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。 通过ICAgent插件采集指标数据时,采集周期为1分钟,不支持修改。 关联指标项存储时长 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。
建中间件接入AOM。 第三方云厂商或互联网数据中心自建Prometheus对接到AOM Prometheus实例 云上用户经常会遇到多云或者跨region采集自建Prometheus指标数据场景。典型场景例如:将者第三方云厂商或互联网数据中心(Internet Data Cent
通信协议监控项可以对通信协议的访问进行监控,可以监控的通信协议包含Websocket类型。 相关配置请参见查看组件通信协议监控项。 数据库 数据库监控项可以对数据库的访问进行监控,可以监控的数据库包含C3P0连接池、Cassandra、ClickHouse、DBCP、Druid、EsRestClient
String 状态 表4 rule字段数据结构说明 参数名称 参数类型 描述 name string 策略名称 conditions 参见表5 匹配条件具体内容。 actions 参见表6 指定策略匹配成功后执行的动作。 表5 conditions字段数据结构说明 参数名称 参数类型 描述
aom:metric:list √ × 查询时序数据 POST /v2/{project_id}/samples aom:metric:list √ × 查询指标 POST /v1/{project_id}/ams/metrics aom:metric:get √ × 查询监控数据 POST /v1/{p
String 状态 表4 rule字段数据结构说明 参数名称 参数类型 描述 name String 策略名称。 conditions 参见表5 匹配条件具体内容。 actions 参见表6 指定策略匹配成功后执行的动作。 表5 conditions字段数据结构说明 参数名称 参数类型 描述
Bandwidth 表示通过PCIe总线传输/接收的数据速率,包括协议标头和数据有效负载。 该值表示一个时间间隔内的平均值,而不是瞬时值。 该速率在时间间隔内平均。例如,在1秒内传输1 GB数据,则无论以恒定速率还是突发传输数据,速率都是1 GB/s。理论上的最大PCIe Gen3带宽为每通道985
ometheus数据采集和数据存储分析的逻辑单元。 Prometheus探针 部署在用户侧或者云产品侧Kubernetes集群。负责自动发现采集目标、采集指标和远程写到其他库。 Exporter 一个采集监控数据并通过Prometheus监控功能规范对外提供数据的组件。目前有上百个官方或者第三方
”文本框中删除对应的成员账号。 接入云服务:从云服务下拉列表中选择需要监控的一个或多个云服务。 数据存储:组织内子账号指标数据接入Prometheus For聚合实例后,子账号保留数据。系统默认不选择。 添加云服务支持的相关指标:单击“新增指标”,依次为接入的云服务添加相关指标。
错误时延设置:支持配置1s、3s、5s、10s、15s。 单击组件之间的连线,会在右侧显示详细的请求数、平均RT、错误率等数据。 单击“只显示组件之间调用”后的按钮,仅展示组件之间的调用数据。 右键单击某一个组件图标,选择 “查看调用链”或者“查看指标”,支持查看调用链或组件指标,详情请参见查看调用链和查看组件性能指标。
内满足搜索条件的事件。 您可参考表1执行如下操作: 表1 操作说明 操作 方法 说明 查看事件统计数据 单击“事件分布图”,可通过柱状图查看在指定时间范围内和搜索条件下事件的统计数据。 - 父主题: 告警管理
应用示例 查询时间序列 查询时序数据 查询指定告警行动规则详细信息
该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Byte/s) 下行Pps(aom_node_network_receive_packets) 每秒网卡接收的数据包个数。 ≥0 个/秒(Packet/s) 下行错包率(aom_node_network_receive_error_packets) 每秒网卡接收的错误包个数。
内满足搜索条件的告警。 您可参考表1执行如下操作: 表1 操作说明 操作 方法 说明 查看告警统计数据 单击“告警分布图”,可通过柱状图查看在指定时间范围内和搜索条件下告警的统计数据。 - 清除告警 在当前告警列表中单击目标告警所在“操作”列中的。 告警故障已经解除时可进行清除操作。