检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
告警监控 AOM告警监控概述 配置AOM告警通知 配置AOM告警规则 查看AOM告警或事件 配置AOM告警降噪
告警管理 告警管理使用说明 告警规则(旧版) 告警规则(新版) 创建通知规则 查看告警 查看事件 告警行动规则 告警降噪
单击“购买终端节点”。 在购买终端节点页面,选择终端节点所在的区域,“服务类别”选择“云服务”,在“选择服务”下方查找并选择AOM的云服务,并且勾选“创建内网域名”,选择终端节点所在的虚拟私有云和子网,其他参数默认设置,更多操作请参考购买终端节点。 图1 购买终端节点 设置完成后,单击“立即购买”。
AOM 2.0控制台入口 CES控制台入口 参考文档链接 告警屏蔽 告警屏蔽指云监控根据屏蔽规则对告警触发后的通知消息进行屏蔽,屏蔽生效后仅产生告警记录将不会接收到告警通知。 用户可屏蔽某个资源或某个资源下的告警策略。 登录AOM 2.0控制台。 在左侧导航栏中选择“告警中心 > 告警降噪”。
指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件,以便您在第一时间发现异常并进行处理。 告警通知 AOM提供了告警通知功能,您可通过创建通知规则、告警行动规则或告警降噪进行详细配置,当AOM自身或外部服务存在异常或可能存在异常而产生告警时,可利用此功能将告
最佳实践一览表 最佳实践 说明 通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 通过多账号聚合Prometheus实例实现指标数据统一监控 本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 应用发现最佳实践 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和
告警规则(包含阈值规则和事件类告警规则)最多可创建1000个。 静态阈值模板 静态阈值模板最多可创建50个。 通知规则(非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域) 发送通知可选择主题数 每个通知规则最多可选择5个主题。 日志 单条日志大小 每条日志最大10KB,超出后
用表格中。如何通过接口查询AOM监控的阈值规则,请参见查询阈值规则列表。 新建转换器。 在使用OpenAPI中alarm的内容时,需要通过转换器将所需的字段转换为您所需要的格式。本示例中,需要将数据转换为数组格式。 单击“默认团队空间”,返回AstroCanvas项目列表页面。 图10
Prometheus实例变更后对计费的影响 场景:自定义指标上报从Prometheus实例A切换到Prometheus实例B。 影响:如果您在购买按需计费实例后变更了指标上报的Prometheus实例,会产生一个新账单并开始按新配置的价格计费,旧账单停止计费。 如果您在一天内多次变更指标上报的
您开通基础版,可单击“切换版本”进行切换操作。您需要注意的是,AOM每24小时仅支持一次从按需版退回到基础版本的操作,退回基础版本后资源使用超出基础版本配额限制的,将进行数据清理,请确认并了解风险。 登录AOM控制台,进入“总览>监控概览”,单击顶部“切换版本”。 选择版本,勾选提示信息,单击“立即切换”。
insecure_skip_verify: true bearer_token: 'SE**iH' 检查内网域名配置。 由于上述配置中的数据上报是通过内网进行数据传输,因此需要确保您的Prometheus所在的主机能够解析内网域名,请参考配置内网DNS。 重新启动Prometheus。 可通过Grafana查
告警规则(包含阈值规则和事件类告警规则)最多可创建1000个。 静态阈值模板 静态阈值模板最多可创建50个。 通知规则(非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域) 发送通知可选择主题数 每个通知规则最多可选择5个主题。 日志 单条日志大小 每条日志最大10KB,超出后
连续周期:连续多少个周期满足阈值条件后,发送阈值告警。 统计周期:指标数据按照所设置的统计周期进行聚合。 告警级别:阈值告警的级别,包括:紧急、重要、次要、提示。 图1 自定义静态阈值模板 单击“立即创建”。 更多静态阈值模板操作 静态阈值模板创建完成后,您还可以执行表1中的操作。
统一告警管理:提供Prometheus、日志、云服务统一告警规则管理,统一告警模板管理,统一告警通知对象管理;预置100+告警模板,支持告警分组、抑制、静默等多种降噪方式,支持自定义消息模板和多种通知渠道(邮件、短信、语音、企业微信、钉钉、飞书、Webhook)。 统一监控大盘:支持自定
析指标、日志、告警数据,直击异常。 精准告警 构建指标告警、事件告警、日志告警的统一告警体系,提供分组、抑制和静默等告警降噪策略,结合告警通知和订阅等功能,帮助用户从容应对海量告警风暴,快速检测和修复业务告警。 统一可视化 支持对多种数据源,在同一个仪表盘中统一监控与分析,并以折
应用并进行监控。 跨云服务的分布式应用监控:对于同时使用了多种云服务的分布式应用,提供统一的运维平台,便于您对业务进行立体排查。 告警灵活通知:提供多种异常检测策略并支持丰富的异常告警触发方式及API。 图1 巡检与问题定界 立体化运维 您需全方位掌控系统的运行状态,并快速响应各类问题。
企业可以在成本中心的“预算管理”页面创建精细粒度的预算来管理成本和使用量,在实际或预测超过预算阈值时,自动发送通知给指定消息接收人。企业还可以创建预算报告,定期将指定预算进展通知给指定消息接收人。 详细介绍请参见使用预测和预算来跟踪成本和使用量。 资源优化 您可以通过AOM的监控功能
错误码说明 100 Continue 继续请求。 这个临时响应用来通知客户端,它的部分请求已经被服务器接收,且仍未被拒绝。 101 Switching Protocols 切换协议。只能切换到更高级的协议。 例如,切换到HTTP的新版本协议。 200 OK 请求响应成功。 201 Created