云容器引擎 CCE-新一代云原生可观测平台之CCE服务日志和告警篇:一站式告警配置

时间:2024-09-03 08:29:24

一站式告警配置

为了让用户在极短时间内完成系统的基本告警配置,CCE服务联合 AOM 服务推出云原生专属告警模板,一键即可配置云原生系统的告警规则。此告警模板基于华为云日常运维经验总结提炼,内容涵盖了集群故障事件以及集群、节点、负载资源监控阈值等多方面的常见故障场景。用户只需要在CCE开启告警中心,绑定故障通知人员的邮箱或手机即可。

图2 一键开启

另外,告警中心还具备告警通知组配置、告警规则配置、告警查看回溯等能力,让运维人员能够一站式完成告警的配置和处理流程,完成闭环。

告警中心基于华为云 SMN 服务提供告警通知组能力。通过配置告警通知组,能够在故障产生时根据问题触发系统的种类和级别及时通知相应的运维人员介入处理。

图3 配置告警通知组

告警规则可通过告警模板一键下发,涵盖集群常用的指标告警和事件告警。当然,用户也可以自由选配这些告警规则。

图4 配置告警规则

当告警产生时,告警通知人会及时收到告警通知,并可以通过告警中心提供的可视化界面查看和消除告警。为方便用户对已发生故障进行回溯,告警中心也同样支持查看历史已经消除的告警。

图5 告警列表
support.huaweicloud.com/bulletin-cce/cce_bulletin_0070.html