检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Redis Exporter接入AOM实现指标监控 应用场景 使用数据库Redis过程中需要对Redis运行状态进行监控,以便了解Redis服务是否运行正常,及时排查Redis故障等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Redis运行
168.0.106的相关告警。 您可参考表2执行如下操作: 表2 操作说明 操作 说明 查看告警或事件统计数据 单击,可通过柱状图查看在指定时间范围内和搜索条件下告警或事件的统计数据。 清除告警 告警故障已经解除时可进行清除操作。 清除一个告警:单击目标告警所在“操作”列中的“”。
告警级别设置为“紧急”。 当连续3个统计周期,主机CPU内核占用率的最大值大于0.2时,则触发紧急告警。 指标 需要监控的指标,仅支持英文展示和英文搜索。 单击“指标”文本框,通过下列框右侧的资源树,可以按资源类型快速选择需监控的指标。 统计周期 指标数据按照所设置的统计周期进行聚合,包括:1
表1 网络指标 指标名称 指标含义 取值范围 单位 下行Bps(aom_node_network_receive_bytes) 该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Byte/s) 下行Pps(aom_node_network_receive_packets)
iagent。 镜像概述 镜像是一个包含了软件及必要配置的云服务器或裸金属服务器模板,包含操作系统或业务数据,还可以包含应用软件(例如,数据库软件)和私有软件。镜像分为公共镜像、私有镜像、共享镜像和市场镜像。 镜像服务(Image Management Service)提供简单方
database # 启用数据库指标采集 - --collect.collection # 启用集合指标采集 - --collect.topmetrics # 启用数据库表头指标信息采集
ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。 0~100 百分比(%) ma_container_cpu_used_core CPU内核占用量 该指标用于统计测量对象已经使用的CPU核个数 ≥0 核(Core) ma_container_cpu_limit_core
关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可以通过快速分析功能,指定查询日志关键词,AOM能够针对您配置的关键词进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。 约束与限制 快速分析的对象为结构化日志中提取的关键字段,创建快速分析前请先对原始日志进行结构化配置。
的时候,配置指标数据。 统计周期:指标数据按照所设置的统计周期进行聚合。统计周期与统计时段相关联,选择的时段不同,统计周期的显示也会相应变化。 统计周期具体说明请参见时间范围和统计周期的关系,如果您使用的是新版仪表盘,统计周期具体说明请参见时间范围和统计周期的关系。 条件:指标监
主机状态图表:实时监控主机的状态。 图4 主机状态图表 组件状态图表:实时监控组件的状态。 图5 组件状态图表 资源TopN图表 资源TopN图表的统计单位为集群,统计对象为集群下的资源(这里的资源指主机、组件和实例)。资源TopN图表可视化地展示了集群中资源占用最高的N个资源,支持资源Top5、
的时候,配置指标数据。 统计周期:指标数据按照所设置的统计周期进行聚合。统计周期与统计时段相关联,选择的时段不同,统计周期的显示也会相应变化。 统计周期具体说明请参见时间范围和统计周期的关系,如果您使用的是新版仪表盘,统计周期具体说明请参见时间范围和统计周期的关系。 条件:指标监
户的真实体验感受,减少流失率,提升用户转化率成为企业的难题。 解决方案 AOM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到服务器、用户请求的完整过程,实时感知用户对应用的满意度,帮助您全面了解用户体验状况。对于用户体验差的事务,通过拓扑和调用链完成事务问题定位。
提供报表分析、SQL查询、实时监控、关键词告警等能力。 AOM的基础版和按需版所对应的日志存储时长、大小和计费方式不同,详见收费详情。 日志流量 日志流量指的是每秒上报的日志大小。每个租户在每个Region的日志流量不能超过10MB/s。如果超过10MB/s,则可能导致日志丢失。
aom_process_cpu_usage 统计周期 指标数据按照所设置的统计周期进行聚合。 1分钟 条件 指标监控的维度。不设置则表示选中全部资源。本示例可不填写。 - 分组条件 指标数据按指定字段分组聚合,对聚合的结果进行运算。 不分组 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最
设置告警条件。单击“自定义创建”,设置统计周期、连续周期、阈值条件等触发条件参数。具体的参数说明如表1所示。 表1 告警条件填写说明 参数类别 参数名称 参数说明 触发条件 统计周期 指标数据按照所设置的统计周期进行聚合。默认只统计一个周期,最多可统计5个周期指标数据。 连续周期 连续
统计方式:指标数据按照所设置的统计方式进行聚合。 统计周期:指标数据按照所设置的统计周期进行聚合。 选择是否发送通知:当阈值规则的状态(正常、超限阈值、数据不足)发生变化时,选择是否发送邮件或短信通知该变动。 如需使用邮件或短信方式发送通知,请选择“是”,则需设置通知策略,选择已创建的主题,选择触发场景。
常见计费问题 如何查看每天的自定指标上报量? AOM控制台的“资源消耗”界面会展示每天指标上报量展示,具体操作请参见统计资源消耗。 如何查看有哪些Prometheus指标? 目前仅default类型、CCE类型、云服务类型的Prometheus实例支持指标查看功能。 登录AOM 2
)、函数工作流(FunctionGraph)、云数据库 GaussDB、图引擎服务(GES)、云数据库 GaussDB(for MySQL)、云数据库(GeminiDB Redis)、云数据库(GeminiDB Mongo)、云数据库(GeminiDB Cassandra)、华为
该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_node_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) CPU使用率(aom_node_cpu_usage) 该指标用于统计测量对象的CPU使用率。
eus实例。 设置告警规则详情。 指标的详细设置由统计周期、条件、检测规则、触发条件以及告警级别组成。指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(>=、<=、>、<)和阈值组成。例如,统计周期为“1分钟”,检测规则设置为“平均值>1”,触发