检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
表1 AOM 最佳实践一览表 最佳实践 说明 通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
查看告警详情 单击告警名称可查看告警详情,包括告警信息和修复建议,如果在创建告警规则时关联了告警行动规则(告警通知规则)或告警降噪规则,还可查看行动规则(通知规则)或告警降噪规则相关信息。
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因?
AOM告警可以对接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 应用发现最佳实践 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。
Prometheus实例变更后对计费的影响 场景:自定义指标上报从Prometheus实例A切换到Prometheus实例B。 影响:如果您在购买按需计费实例后变更了指标上报的Prometheus实例,会产生一个新账单并开始按新配置的价格计费,旧账单停止计费。
SMN:消息通知服务 枚举值: SMN smn_channel SmnResponse object 通知结果详情 表7 SmnResponse 参数 参数类型 描述 sent_time Long 发送时间。
由于上述配置中的数据上报是通过内网进行数据传输,因此需要确保您的Prometheus所在的主机能够解析内网域名,请参考配置内网DNS。 重新启动Prometheus。 可通过Grafana查看AOM中的指标数据,来验证上述配置修改后数据上报是否成功。
这个临时响应用来通知客户端,它的部分请求已经被服务器接收,且仍未被拒绝。 101 Switching Protocols 切换协议。只能切换到更高级的协议。 例如,切换到HTTP的新版本协议。 200 OK 请求响应成功。 201 Created 创建类的请求完全成功。
通知规则(非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域) 发送通知可选择主题数 每个通知规则最多可选择5个主题。 日志 单条日志大小 每条日志最大10KB,超出后ICAgent将不会采集该条日志,即该条日志会被丢弃。
通知规则(非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域) 发送通知可选择主题数 每个通知规则最多可选择5个主题。 日志 单条日志大小 每条日志最大10KB,超出后ICAgent将不会采集该条日志,即该条日志会被丢弃。
精准告警 构建指标告警、事件告警、日志告警的统一告警体系,提供分组、抑制和静默等告警降噪策略,结合告警通知和订阅等功能,帮助用户从容应对海量告警风暴,快速检测和修复业务告警。
统一告警管理:提供Prometheus、日志、云服务统一告警规则管理,统一告警模板管理,统一告警通知对象管理;预置100+告警模板,支持告警分组、抑制、静默等多种降噪方式,支持自定义消息模板和多种通知渠道(邮件、短信、语音、企业微信、钉钉、飞书、Webhook)。
告警灵活通知:提供多种异常检测策略并支持丰富的异常告警触发方式及API。 图1 巡检与问题定界 立体化运维 您需全方位掌控系统的运行状态,并快速响应各类问题。 AOM提供从云平台到资源,再到应用的监控和微服务调用链的立体化运维分析能力。
成本优化 成本控制 企业可以在成本中心的“预算管理”页面创建精细粒度的预算来管理成本和使用量,在实际或预测超过预算阈值时,自动发送通知给指定消息接收人。企业还可以创建预算报告,定期将指定预算进展通知给指定消息接收人。 详细介绍请参见使用预测和预算来跟踪成本和使用量。
运维(可选) 您可使用AOM的仪表盘、告警通知等功能进行日常运维。
表6 QueryAlarmResult 参数 参数类型 描述 action_enabled Boolean 是否启用通知。 alarm_actions Array of strings 告警状态通知列表。 alarm_advice String 告警清除建议。
审批通知方式当前支持邮件和短信2种方式。 执行策略 选择是否开启分批发布开关,默认不打开。 每批发布:开启分批发布后需填写每批发布数量。 每批间隔:开启分批发布后需填写每批发布的时间间隔。 父主题: 运维管理
表5 QueryAlarmResult 参数 参数类型 描述 action_enabled Boolean 是否启用通知。 alarm_actions Array of strings 告警状态通知列表。 alarm_advice String 告警清除建议。
最小长度:0 最大长度:1024 type 是 String 规则类型: "1":通知。 "2":用户。
功能说明 表1 功能说明 功能名称 功能说明 AOM 2.0控制台入口 CES控制台入口 参考文档链接 一键告警 一键告警为您提供针对服务下所有资源快速开启告警的能力,旨在帮助用户快速建立监控告警体系,在资源异常时可以及时获得通知。