检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
但不重要的告警,为减少这类告警对运维的干扰,可以通过告警屏蔽进行处理,以便更好的关注真正重要的告警。 用户可屏蔽某个资源或某个资源下的告警策略、系统事件。 父主题: 告警屏蔽
关联类型。ALARM_RULE:关联告警规则,RESOURCE:关联资源,RESOURCE_POLICY_NOTIFICATION:关联资源策略屏蔽告警通知,RESOURCE_POLICY_ALARM:关联资源策略不计算告警。 枚举值: ALARM_RULE RESOURCE RESOURCE_POLICY_NOTIFICATION
_ALARM时填屏蔽的告警策略编号; 数组长度:1 - 100 relation_type 否 String 关联类型。ALARM_RULE:关联告警规则,RESOURCE:关联资源,RESOURCE_POLICY_NOTIFICATION:关联资源策略屏蔽告警通知,RESOUR
可创建资源分组个数 1000 单个资源分组单次添加资源数 1000 单个资源分组资源总数 10000 可创建监控站点个数 20 告警模板策略个数 50
源的告警规则。 设置告警屏蔽 当您在资源分组中需要针对某些指定资源屏蔽告警时,云监控服务支持您在“资源详情>告警规则”页面快速设置告警屏蔽策略。 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“资源分组”,进入“资源分组”页面。
进行配置推荐。 图4 云服务概览 图5 关键指标 配置云服务告警规则 各类云服务需要给哪些指标配置告警,可参考最佳监控实践推荐的指标及告警策略。最佳实践如:华为云监控配置最佳实践 v5.3.1.xlsx。 步骤: 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“云服务监控
429 错误码 ces.0429 可能原因 原因1:API被流控。详见下方【案例一】 解决方法 若API被流控,需第一时间找运维人员配置新的流程策略。 案例一 API被流控 查看弹性云服务器ID为6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d的CPU使用率在2019-04-30
告警规则适用的资源范围,可选择资源分组或指定资源。 说明: 当监控对象为指定资源时,可新增多个监控对象,并可解除原监控对象。 触发规则 自定义创建。 告警策略 触发告警规则的告警策略。 例如:可用性连续三个周期≤90%,每一小时告警一次。 每一小时告警一次是指告警发生后如果状态未恢复正常,每间隔一个小时重复发送一次告警通知。
有一个后端,则业务会中断。 健康检查恢复正常 healthCheckRecovery 次要 后端服务器健康检查恢复正常。 无需处理。 负载均衡器到后端服务器流量恢复正常。 表6 云备份 事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 CBR SYS
String 企业项目ID alarm_template_id String 告警规则关联告警模板ID,如果传了,告警规则关联的策略会和告警模板策略联动变化 表6 Policy 参数 参数类型 描述 metric_name String 资源的监控指标名称,必须以字母开头,只能
429 错误码 ces.0429 可能原因 原因1:API被流控。详见下方【案例一】 解决方法 若API被流控,需第一时间找运维人员配置新的流程策略。 案例一 API被流控 查看弹性云服务器ID为6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d的CPU使用率在2019-04-30
有一个后端,则业务会中断。 健康检查恢复正常 healthCheckRecovery 次要 后端服务器健康检查恢复正常。 无需处理。 负载均衡器到后端服务器流量恢复正常。 表6 云备份 事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 CBR SYS
template_items 是 Arrays of objects 创建自定义告警模板添加一个或者多个指标的告警规则,目前最多可增加20组告警规则策略。 详细参数说明请参见表3。 表3 template_items字段数据结构说明 名称 是否必选 参数类型 说明 metric_name 是
CS或BMS的正常使用,避免因为对资源的过度使用造成业务无法正常运行。 处理异常场景 云监控服务会根据您创建的告警规则,在监控数据达到告警策略时发送告警信息,让您及时获取异常通知,查询异常原因。 扩容场景 对CPU使用率、内存使用率、磁盘使用率等监控项创建告警规则后,可以让您方便
template_items 是 Arrays of objects 创建自定义告警模板添加一个或者多个指标的告警规则,目前最多可增加20组告警规则策略。 表3 template_items字段数据结构说明 名称 是否必选 参数类型 说明 metric_name 是 String 告警模板
告警描述,长度0-256 namespace String 指标命名空间 policies Array of Policy objects 告警策略 数组长度:1 - 100 resources Array of ResourcesInListResp objects 资源列表,关联资源需要使用查询告警规则资源接口获取
通过云监控服务开放的丰富API和调用示例,您可以使用并管理监控指标和告警规则、查询监控数据等。 最佳实践 API概览 API说明 快速入门 策略和授权项说明 02 入门 快速让您了解什么是主机监控、站点监控以及如何查看主机监控数据和站点监控数据。 快速入门 使用主机监控 使用站点监控
控维度可查看支持监控的服务列表。 template_items Array of objects 否 自定义告警模板添加的一组或者多个告警策略。 详细参数说明请参见表3。 template_id String 否 自定义告警模板的ID,如:at1603330892378wkDm77y6B。
% 2.4.5 1分钟 操作系统监控指标: CPU负载 指标 指标名称 指标说明 单位 支持版本 监控周期(原始指标) load_average1 (Agent) 1分钟平均负载 该指标用于统计测量对象过去1分钟的CPU平均负载。 采集方式(Linux):通过/proc/load
实例运行状态异常 由于灾难或者物理机故障导致单机或者主实例出现故障时会上报本事件,属于关键告警事件,有可能导致数据库服务不可用。 检查是否有设置自动备份策略,并且提交工单处理。 单实例转主备实例失败 即创建备机或者备机创建完成后在主备机之间配置同步有故障,一般是由于备节点所在数据中心资源不足导