检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
表1 搜索条件说明 搜索条件 搜索条件说明 设置样例 事件级别 支持选择如下事件级别进行搜索: 紧急 重要 次要 提示 事件级别:重要,即可查询出指定时间范围内事件级别为“重要”的事件。 资源类型 支持选择资源类型别进行搜索。
该规则监控对象为AOM服务的紧急告警事件,当服务事件满足已设的通知策略时,系统就会以邮件、短信等方式发送告警通知给指定人员。 图5 事件类告警规则 更多事件类告警规则操作 事件类告警规则创建完成后,您还可以执行表2中的操作。
例如,统计周期为“1分钟”,检测规则设置为“平均值>1”,触发条件为连续周期“3”,告警级别为“紧急”,表示连续三个统计周期,指标的平均值大于已设置的阈值1时,生成紧急告警。 图9 设置告警规则 单击“高级设置”,设置检查频率、告警恢复等信息。 设置告警通知策略。
支持LTS的podlb域名的切换能力。 5.12.111 新增线程指标、修复“获取lvs磁盘分区指标失败”问题。
由于上述配置中的数据上报是通过内网进行数据传输,因此需要确保您的Prometheus所在的主机能够解析内网域名,请参考配置内网DNS。 重新启动Prometheus。 可通过Grafana查看AOM中的指标数据,来验证上述配置修改后数据上报是否成功。
触发条件设置为“连续周期:3” 告警级别设置为“紧急”。 当连续3个统计周期,主机CPU内核占用率的最大值大于0.2时,则触发紧急告警。 指标 需要监控的指标。通过“全量指标”方式选择指标时,仅支持英文展示和英文搜索。
触发条件设置为“连续周期:3” 告警级别设置为“紧急”。 当连续3个统计周期,主机CPU内核占用率的最大值大于0.2时,则触发紧急告警。 指标 需要监控的指标。通过“全量指标”方式选择指标时,仅支持英文展示和英文搜索。
${domain_name} 通知类型 创建通知规则时选择的类型:告警或事件 ${event_type} 事件级别 创建通知规则时选择告警或事件级别:紧急、重要、次要、提示 ${event_severity} 事件名称 触发通知规则的告警或事件的名称 $event.metadata.event_name
告警级别:事件告警的级别,包括: :表示紧急告警。 :表示重要告警。 :表示次要告警。 :表示提示告警。 选择多个事件的场景下,单击“批量编辑”,可为当前选择的所有事件批量设置告警条件。 设置告警通知策略。
单击代理区域名称,可查看该代理区域下的代理机。 删除代理机 用户可根据需要删除不再使用的代理机,具体操作如下: 在左侧导航栏中,选择“采集设置 > 代理区域管理”,进入代理区域管理页面。 单击代理机对应操作列的“删除”。 在弹出的对话框中,单击“确认”,可取消代理机。
表1 搜索条件说明 搜索条件 搜索条件说明 设置样例 告警级别 支持选择如下告警级别进行搜索: 紧急 重要 次要 提示 告警级别:重要,即可查询出指定时间范围内告警级别为“重要”的告警。 资源类型 支持选择资源类型别进行搜索。
例如,统计周期为“1分钟”,检测规则设置为“平均值>1”,触发条件为连续周期“3”,告警级别为“紧急”,表示连续三个统计周期,指标的平均值大于已设置的阈值1时,生成紧急告警。 单击“高级设置”,设置检查频率、告警恢复等信息。 设置告警通知策略。
步骤一:创建分组规则 创建一个分组规则,当产生AOM的紧急、重要告警时,触发“Monitor_host”行动规则,且告警按照告警源合并分组。 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警降噪”。
告警级别 事件告警的级别,包括: :表示紧急告警。 :表示重要告警。 :表示次要告警。 :表示提示告警。 设置完成,单击“确定”。 (可选)为CCEFromProm服务新增PromQL告警规则。 选择“新增告警规则 > 新增PromQL告警规则”。
告警级别 阈值告警的级别,包括:紧急、重要、次要、提示。 高级设置 告警恢复 监控周期内监控对象不满足触发条件时,则恢复告警。默认只监控一个周期,最多可监控5个周期指标数据。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要启动或者关闭。
${starts_at} 触发级别 创建告警规则时选择告警或事件级别:紧急、重要、次要、提示。 ${event_severity} 告警内容 详细的告警信息说明。 ${alarm_info} 资源标识 触发告警或事件对应的具体资源。
Site domain name suffix :站点域名后缀,例如“myhuaweicloud.com”。 version:当前所安装的Uniagent的版本。
告警级别 阈值告警的级别,包括:紧急、重要、次要、提示。 高级设置 告警恢复 监控周期内监控对象不满足触发条件时,则恢复告警。默认只监控一个周期,最多可监控5个周期指标数据。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要启动或者关闭。
1:紧急,2:重要,3:一般,4:提示。 枚举值: 1 2 3 4 alarm_rule_name 是 String 阈值规则名称。规则名称包含大小写字母、数字、特殊字符(-_)和汉字组成,不能以特殊字符开头或结尾,最大长度为100。
1:紧急,2:重要,3:一般,4:提示。 枚举值: 1 2 3 4 alarm_rule_name 是 String 阈值规则名称。规则名称包含大小写字母、数字、特殊字符(-_)和汉字组成,不能以特殊字符开头或结尾,最大长度为100。