检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
支持创建告警降噪策略。告警降噪策略分为路由分组、去重、抑制、静默四部分,作用于发送告警通知之前对告警按照策略规则链条进行处理,通过所有规则后,再发送通知。 2021-08-20 支持AOM日志接入LTS 通过添加接入规则,可以将AOM中的CCE或自定义集群的日志映射至LTS,通过LTS查看和分析日志。映射不会产生额外的费用(除重复映射外)。
器入门。 执行命令将install_uniagentd_self_OS.sh脚本下载到弹性云服务器上的/root 目录下: 下载命令的拼接规则:wget https://aom-uniagent-{region_id}.{obs_domain}/install_uniagentd_self_OS
在左侧导航栏中选择“告警管理 > 告警规则”。 在“指标或事件”页签单击“创建”。 设置告警规则的规则名称等基本信息。 告警规则设置。规则类型选择“指标告警规则”,配置方式选择“全量指标”,并在下拉列表中选择Prometheus实例。 设置告警规则详情。 指标的详细设置由统计周期、条件、检测规则、触发条件以
坡区域) 告警规则 告警规则(包含阈值规则和事件类告警规则)最多可创建1000个。 静态阈值模板 静态阈值模板最多可创建50个。 通知规则(非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域) 发送通知可选择主题数 每个通知规则最多可选择5个主题。
单击删除。 动态资源 资源匹配规则 根据界面提示,选择所需的资源匹配规则。 如果您需要配置多条规则,可单击“添加规则”。 如果您需要删除单条资源匹配规则,可单击。 说明: 资源添加方式选择“动态资源”才会显示。 最多可以添加100条资源匹配规则。 - 资源类型 根据实际选择资源
默认消息模板变量说明 变量名称 变量说明 变量定义 告警名称 触发的告警规则的名称。 ${event_name} 告警ID 触发的告警规则的ID。 ${id} 告警行动规则(通知规则) 发送告警通知的告警行动规则(通知规则)名称。 ${action_rule} 触发时间 触发此告警或事件的时间。
坡区域) 告警规则 告警规则(包含阈值规则和事件类告警规则)最多可创建1000个。 静态阈值模板 静态阈值模板最多可创建50个。 通知规则(非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域) 发送通知可选择主题数 每个通知规则最多可选择5个主题。
None 操作指导 应用运维管理 AOM 如何创建告警规则 04:10 创建告警规则
登录弹性云服务器,修改跳板机ECS使用的安全组规则。 在ECS详情页,单击安全组页签,进入安全组列表页。 单击具体的安全组名,单击“更改安全组规则”,进入安全组详情页。 在该安全组详情页,单击“入方向规则 > 添加规则 ”,按表 安全组规则添加安全组规则。 表1 安全组规则 方向 协议 端口 说明 入方向
登录弹性云服务器,修改跳板机ECS使用的安全组规则。 在ECS详情页,单击安全组页签,进入安全组列表页。 单击具体的安全组名,单击“更改安全组规则”,进入安全组详情页。 在该安全组详情页,单击“入方向规则 > 添加规则 ”,按表 安全组规则添加安全组规则。 表1 安全组规则 方向 协议 端口 说明 入方向
配置AOM告警通知 创建AOM告警消息模板 创建CES通知对象和通知组 创建AOM告警行动规则(告警通知规则) 父主题: 告警监控
有AOM FullAccess中定义的删除应用发现规则权限,您可以创建一条拒绝删除应用发现规则的自定义策略,然后同时将AOM FullAccess和拒绝策略授予用户,根据Deny优先原则,则用户可以对AOM执行除了删除应用发现规则外的所有操作。拒绝策略示例如下: { "Version":
有AOM FullAccess中定义的删除应用发现规则权限,您可以创建一条拒绝删除应用发现规则的自定义策略,然后同时将AOM FullAccess和拒绝策略授予用户,根据Deny优先原则,则用户可以对AOM执行除了删除应用发现规则外的所有操作。拒绝策略示例如下: { "Version":
already exists. 应用规则名称已存在 请修改规则名称。 500 SVCSTG.INV.5000007 The maximum number of rules has been reached. 已达到最大规则数 请删除不需要的规则后重新添加规则。 500 SVCSTG_AMS_5000000
建告警规则和导出原始监控数据。 查看监控指标 在监控指标页面上,您可以查看基于近1小时、近3小时 、近12小时、近 24小时、近7天和近30天收集的原始数据的图表。您可以自定义选择要查看的监控指标,数据可实现自动刷新。 创建告警规则 用户对云服务的核心监控指标设置告警规则,当监控
默认3000+,最多支持10000+。 告警模板可添加告警规则数 仅支持50。 支持添加20+云服务,每个云服务支持添加100+告警规则。 历史告警保存时间 7天。 1年。 单次创建告警规则可选择的被监控对象数 5000 不限制,支持全部资源、正则匹配、精准匹配。 聚合告警 不支持 支持基于PromQL语
进行处理。 阈值规则 阈值规则:对资源的指标设置阈值条件,当指标数据满足阈值条件时,会产生阈值告警(阈值告警即由阈值规则触发而产生的告警);当没有指标数据上报时,会产生数据不足事件(数据不足事件即由阈值规则触发而产生的事件)。同时执行自定义的触发策略,当阈值规则的状态(正常、超限
应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
兼容旧版仪表盘的图表配置。 新增告警规则 添加图表时,新增告警规则 单击页面中的“添加图表”或单击页面右上角的。 选择指标后,在指标列表右上方单击,可为当前添加的所有指标新增告警规则。具体操作请参见创建指标告警规则。 修改图表时,新增告警规则 选择待操作的仪表盘,将光标移至某一图表框右上角,单击,选择“编辑”。
管理Prometheus实例指标数据 使用Prometheus监控CCE集群指标 配置多账号聚合实现指标统一监控 配置CCE集群监控采集指标规则 配置预聚合规则提升指标查询效率 配置数据多写实现监控指标转储到自建Prometheus 配置指标存储时长 通过仪表盘监控Prometheus实例指标数据