检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
管理CCE集群的ICAgent插件 AOM支持对您已购买的CCE(云容器引擎)集群下的主机批量执行ICAgent插件安装、升级和卸载的操作,从而实现对CCE中ICAgent插件的统一管理。 前提条件 已购买CCE(云容器引擎)集群和节点,详细请参考购买Standard/Turbo集群和创建节点。
告警规则(新版) 概述 标签和标注 创建阈值规则 创建静态阈值模板 创建事件类告警规则 父主题: 告警管理
告警规则(旧版) 添加阈值 父主题: 告警管理
添加阈值规则 功能介绍 该接口用于添加一条阈值规则。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/alarm-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,
创建AOM告警行动规则(告警通知规则) AOM提供告警行动规则(告警通知规则)定制功能,您可以通过创建告警行动规则(告警通知规则)关联SMN主题与消息模板,当日志、资源或指标数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 前提条件 已创建一个主题,操作详见创建主题。
创建静默规则 通过静默规则,您可以在指定时间段屏蔽告警通知,静默规则一旦创建完成,即刻生效。 创建静默规则 用户最多可创建100条静默规则。 在左侧导航栏中选择“告警 > 告警降噪”。 在“静默规则”页签下单击“创建静默规则”,设置规则名称、静默条件等信息。 图1 创建静默规则 表1
管理接入规则 本章为您介绍如何添加、查看、删除接入规则。 前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流,也可以在添加接入规则页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南、CCI用户指南;已配置容器服务日志采集路径。 添加接入规则
新增静默规则 功能介绍 新增静默规则。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/alert/mute-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,也可
删除阈值规则 功能介绍 该接口用于删除阈值规则。 调用方法 请参见如何调用API。 URI DELETE /v2/{project_id}/alarm-rules/{alarm_rule_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
修改阈值规则 功能介绍 该接口用于修改一条阈值规则。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/alarm-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,也
修改静默规则 功能介绍 修改静默规则。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/alert/mute-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,也可以
CCE的CPU使用率指标“aom_container_cpu_usage”,当该指标达到告警阈值条件时,产生告警为例,帮助您快速上手使用应用运维管理。 操作流程 开通AOM 2.0并授权。 容器监控:在云容器引擎 CCE购买集群和节点后,自动安装ICAgent插件,将CCE集群指标上报到AOM,用户无需手动接入。
创建AOM应用性能监控告警规则 通过创建应用性能监控类型告警规则可对资源的指标设置阈值条件,当指标数据满足阈值条件时产生阈值告警。 约束与限制 当前仅华北-乌兰察布二零一、华北-北京一、华南-广州、西南-贵阳一、亚太-新加坡、中国-香港、华东-上海一、华东-上海二区域可以直接使用
创建通知规则 该功能对非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域生效。 AOM提供了告警通知功能,您可通过创建通知规则进行详细配置,当AOM自身或外部服务存在异常或可能存在异常而产生告警时,可利用此功能将告警信息通过邮件或短信发送给您
创建统计规则 日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可创建统计规则。统计规则创建成功后,AOM能够针对您配置的关键词周期性地进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。
删除静默规则 功能介绍 删除静默规则。 调用方法 请参见如何调用API。 URI DELETE /v2/{project_id}/alert/mute-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,
错误码 当您调用API时,如果遇到“APIGW”开头的错误码,请参见API网关错误码进行处理。 更多服务错误码请参见API错误中心。 状态码 错误码 错误信息 描述 处理措施 200 SVCSTG.INV.2000000 null 请求正常执行 请求执行完成无需处理。 200 SVCSTG_AMS_2000000
告警风暴。 告警降噪功能分为分组、去重、抑制、静默四部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 图1 告警降噪流程图 分组、抑制、静默需手动创建规则,创建方式见下方文档说明。 此模块只作用于消息通知部分,所有触发的告警和事件都可在告警、事件页面查看。
并且此消息模板不可删除与编辑。 除默认模板的消息字段外,消息模板还支持用户自定义字段,需用户在上报事件告警信息时在指定参数上传该字段,具体实现参考接口文档:API事件告警,对应参数见下方消息模板告警上报结构体。 自定义字段支持以JSONPath的方式取值,示例:$event.metadata
创建抑制规则 使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,