检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
告警抑制规则功能可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警;或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
应用场景 提升用户体验 业务痛点 行业竞争激烈,用户对服务的体验要求高,尤其是用户体验成为互联网企业的核心竞争力。如何能获取用户的真实体验感受,减少流失率,提升用户转化率成为企业的难题。 解决方案 AOM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到服务器
t的版本是不是最新的。 图2 查看ICAgent的版本 节点的时间与实际不同步。 如果节点时间与实际时间相差过大,会导致ICAgent指标上报延迟,从而导致状态判断出现问题。 遇到工作负载状态显示不对的问题,需要排查节点的时间与当前时间相比是否过快或过慢,也可以通过在AOM页面查看NTP指标的偏移进行确认。
按集群维度查看当前集群的节点、工作负载、Pod(容器组)和容器信息。 在左侧导航栏选择“洞察 > 节点”,可实时获取到该集群下查看该集群所有主机节点的概况,包括状态、IP地址、Pod状态、CPU使用率和内存使用率等信息。 在节点列表上方,可按节点名称设置过滤条件,实现节点列表过滤显示。 单
b_status模块对其进行监控,需要确保Nginx服务启用了 stub_status模块。具体步骤如下: 登录到业务Nginx服务所在节点,以root权限用户执行以下命令检查Nginx是否已经启用stub_status模块(一般在/usr/local/nginx/sbin/nginx目录下执行):
t) 该指标用于统计CCE节点上thinpool元数据空间使用百分比。 0~100 百分比(%) Thin pool 数据空间使用率 (aom_host_diskpartition_thinpool_data_percent) 该指标用于统计CCE节点上thinpool数据空间使用百分比。
node_memory_MemTotal_bytes 节点内存总量 node_memory_MemFree_bytes 节点空闲内存 node_memory_MemAvailable_bytes 节点可用内存 node_memory_Cached_bytes 节点页面缓存中的内存 up scrape
元数据空间使用率 该指标用于统计CCE节点上thinpool元数据空间使用百分比。 0~100 百分比(%) aom_host_diskpartition_thinpool_data_percent Thin pool 数据空间使用率 该指标用于统计CCE节点上thinpool数据空间使用百分比。
Exporter,即可采集Linux类型主机节点的相关信息和运行指标,具体操作请参见配置弹性云服务器 ECS接入AOM。 配置弹性云服务器 ECS接入AOM Node Exporter是Prometheus官方提供的Exporter,主要用来采集Linux类型节点的相关信息和运行指标,包括主机的
Exporter已部署成功。有以下三种方法进行验证: 登录集群节点执行如下任意一种命令: curl http://{集群IP}:9114/metrics curl http://{集群任意节点私有IP}:30921/metrics 访问地址:http://{集群任意节点的公网IP}:30921/metrics。
设置完成后,单击“确认”。 已创建的应用会在当前应用区域以树节点的形式呈现。 更多操作 应用创建完成后,您可以在应用树中执行表2中的操作。 表2 相关操作 操作 说明 添加节点 将光标移至待操作的应用名称后,单击,根据需要添加节点,具体操作请参见添加节点。 编辑应用 将光标移至待操作的应用名称后,单击,选择“编辑”。
非华为云主机场景下,如果通过先在一个节点上安装ICAgent,然后通过拷贝此节点镜像的方式安装其他节点,建议新节点上先卸载ICAgent再重新安装,否则可能出现不同节点间ID冲突的问题。因为ICAgent在每个节点上会自动生成唯一的ID文件,拷贝镜像后不同节点的ID文件可能会重复。 采集的日志文件是什么类型的?
Kafka Exporter已部署成功。有以下三种方法进行验证: 登录集群节点执行如下任意一种命令: curl http://{集群IP}:9308/metrics curl http://{集群任意节点私有IP}:30091/metrics 在实例列表中单击操作列下的“更多 >
时产生告警。 准备工作 本章节以监控云容器引擎 CCE的指标为例,需要提前在CCE中购买集群和节点,详细请参考购买Standard/Turbo集群和创建节点。如果您已有可用的集群和节点,可重复使用,不需要再次购买。 首次开通AOM 2.0并授权 注册账号并实名认证。 使用AOM 2
MySQL Exporter已部署成功。有以下三种方法进行验证: 登录集群节点执行如下任意一种命令: curl http://{集群IP}:9104/metrics curl http://{集群任意节点私有IP}:30337/metrics 在实例列表中单击操作列下的“更多 >
CAgent的状态由“升级中”变为“运行”时,表示升级成功。 如果升级后,界面显示ICAgent状态异常或者其它升级失败场景,请直接登录节点使用安装命令重新安装ICAgent即可(覆盖式安装,无需卸载操作)。 父主题: ICAgent管理(华为云主机)
安装了ICAgent,但是监控不到主机是什么原因? 问题描述 安装了ICAgent,且节点上ICAgent进程正常,但是无法监控到主机。 可能原因 一般情况下,在AOM页面看不到主机主要有以下几种原因: ICAgent未安装成功 ICAgent安装成功但是配置错误 ICAgent安装成功但是数据采集失败
支持工程师。 执行以下命令,检查用户侧节点时间。 date 若查询到的用户侧节点时间和所在时区当前时间一致 => 请联系技术支持工程师。 若查询到的用户侧节点时间和所在时区当前时间不一致 => 执行 5。 执行以下命令,重新配置用户侧节点时间。 date -s 所在时区当前时间(例如12:34:56)
Exporter已部署成功。有以下三种方法进行验证: 登录集群节点执行如下任意一种命令: curl http://{集群IP}:9216/metrics curl http://{集群任意节点私有IP}:30003/metrics 访问地址:http://{集群任意节点的公网IP}:30003/metrics。