检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用户最多可创建100条抑制规则。 创建抑制规则 在左侧导航栏中选择“告警 > 告警降噪”。 在“抑制规则”页签下单击 “创建抑制规则”,设置规则名称、根源告警等信息。 图1 创建抑制规则 表1 设置抑制规则 类别 参数名称 说明 - 规则名称 抑制规则的名称。名称只能由大小写字母
配置AOM告警规则 AOM告警规则概述 创建AOM指标告警规则 创建AOM事件告警规则 创建AOM应用性能监控告警规则 创建AOM日志告警规则 创建CES告警规则 创建CES一键告警 批量创建AOM云服务告警规则 创建CES告警模板 管理AOM告警规则 标签和标注 普罗语句说明 父主题:
资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust? 如何通过创建委托获取AK/SK
自定义发现规则 在左侧导航栏中选择“配置管理 > 应用发现”。 单击“添加自定义应用发现规则”,配置应用发现规则。 选择预探测主机。 自定义一个规则规则名称(例如,rule-test)。 选择一个典型的主机(例如,host-test),用于在应用发现规则配置过程中预验证规则的有效性
使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
帮助用户轻松使用AOM。 表1 AOM 最佳实践一览表 最佳实践 说明 通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 通过多账号聚合Prometheus实例实现指标数据统一监控
事件类告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 系统支持创建的阈值规则和事件类告警规则总计不能超过1000条,即创建的告警规则数量不能超过1000条。如果系统中的告警规则数量已达到上限,请删除不需要的告警规则后重新创建。 父主题: 告警规则(新版)
告警行动规则 概述 创建告警行动规则 创建消息模板 父主题: 告警管理
http://localhost:9150/metric 图3 执行命令 配置CCE集群指标采集规则 通过“新增PodMonitor”方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。 登录AOM 2.0控制台。 在左侧菜单栏中选择“Prometheus监控
如何设置全屏模式在线时长? 为保障客户信息的安全性,AOM提供了在线超时退出机制,即:登录控制台后,打开任意一个界面,如果在1小时内无任何操作,则会自动退出到登录界面。 当在使用AOM的全屏模式(包括运维概览全屏模式和仪表盘全屏模式)进行监控时,全屏模式会随着用户账号的退出而退出
修改阈值规则(即将下线) 功能介绍 该接口用于修改一条阈值规则,包括如下工作。 URI PUT /v1/{project_id}/ams/alarms 替换接口请参考修改阈值规则。 请求消息 请求参数 请求参数如表1所示。 表1 请求参数 参数 是否必选 参数类型 取值范围 描述
创建告警规则时,可设置告警标签(Alarm Tag)和告警标注(Alarm Annotation)。告警标签主要应用于告警降噪等场景,为告警标识性属性。告警标注主要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标签特征 告警标签可应用于告警降噪模块的分组规则、抑制规则
AOM提供告警行动规则定制功能,当资源或指标数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 通过创建告警行动规则关联SMN主题与消息模板。 通过创建消息模板,自定义通知消息配置。 告警行动规则创建成功后,可在“告警> 告警降噪> 分组规则”中“创建分组规则”关联行动规则。
查询消息通知模板列表 功能介绍 该接口用于查询消息通知模板列表。 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/events/notification/templates 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是
新增消息通知模板 功能介绍 该接口用于新增消息通知模板。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/events/notification/templates 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
远程登录”,执行如下命令。 curl http://localhost:9114/metric 配置CCE集群指标采集规则 通过“新增PodMonitor”方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。 登录AOM 2.0控制台。 在左侧菜单栏中选择“Prometheus监控
访问:http://{集群任意节点的公网IP}:30091/metrics。 图2 访问地址 配置CCE集群指标采集规则 通过“新增PodMonitor”方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。 登录AOM 2.0控制台。 在左侧菜单栏中选择“Prometheus监控
(推荐)POST方法获取标签名列表 功能介绍 该接口使用POST方法获取标签名列表。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/aom/api/v1/labels 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是
设置完成后,单击“立即创建”,完成分组规则创建。 更多告警分组规则操作 分组规则创建完成后,您还可以执行表2中的相关操作。 表2 相关操作 操作 说明 编辑分组规则 单击“操作”列的“编辑”。 删除分组规则 删除单条规则:单击对应规则“操作”列的“删除”。 删除单条或多条规则:勾选对应规则前的复选框,单击“批量删除”。
操作 说明 查看规则详情 在“名称”列单击规则的名称。 启、停规则 单击“操作”列的“启用”。 单击“操作”列的“停用”。停用后,AOM将不采集进程的指标数据。 删除规则 删除一个发现规则:在“操作”列选择“删除”。 删除一个或多个发现规则:选中一个或多个发现规则前的复选框,单击页面左上角的“删除”。