云运维中心 COC-告警管理概述

时间:2024-12-26 16:15:20

告警管理概述

告警管理功能提供告警数据的收集、纳管和处理。

本功能支持集成多个现有或第三方等监控系统(比如 CES AOM 、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。

本功能还支持汇聚告警的管理。通过设置流转规则,用户可以将接收到的符合指定规则的多条原始告警汇聚成单条告警,或者转事件单处理,同时执行响应预案(脚本/作业/应急预案),并自动通知相应责任人。汇聚告警减少了重复告警,避免了告警风暴,提高用户处理告警的效率。

此外,本功能可以帮助用户高效创建和管理告警规则。其提供了跨账号、跨区域的告警规则配置能力,帮助用户提高批量配置的效率。告警规则目前仅支持CES告警的配置。

图1 告警管理流程
support.huaweicloud.com/usermanual-coc/coc_um_06_02_07.html