检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
AOM告警降噪概述 AOM提供告警降噪功能,您可以在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 功能说明 告警降噪功能分为分组、去重、抑制、静默、屏蔽部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。
和亚太-新加坡区域开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 AOM提供告警降噪功能,您可以在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 告警降噪功能分为分组、去重、抑制、静默四部分。 去重为内置策略,服务后台会自动检验告
配置代理区域和代理机 为解决多云之间网络互通,需要在华为云购买和配置ECS主机为代理机,同时代理机上需要绑定公网IP,AOM通过该代理机下发部署控制命令到远程主机,运维数据也将经过该代理机至AOM。代理区域是对代理机进行分类管理,由多个代理机组成。 配置代理区域和代理机 登录AOM
error. 内部服务器错误 请联系技术支持工程师解决。 500 AOM.12000002 Internal server error. 内部服务器错误 请联系技术支持工程师解决。 500 AOM.02001500 Internal server error. 内部服务器错误 请联系技术支持工程师解决。
TopN接口错误率突增 应用服务整体流量不均:基于应用下所有实例的流量数据,展示应用下最大流量和最小流量实例的流量和时延数据,并展示应用下流量Top5的接口在最大流量和最小流量实例上的分布,快速定位受影响接口。单击所展示的接口,可详细追踪接口近期的调用情况。 图5 应用服务整体流量不均 事件根因分析方法说明
配置代理区域和代理机 为解决多云之间网络互通,需要在华为云购买和配置ECS主机为代理机,同时代理机上需要绑定公网IP,AOM通过该代理机下发部署控制命令到远程主机,运维数据也将经过该代理机至AOM。代理区域是对代理机进行分类管理,由多个代理机组成。 配置代理区域和代理机 登录AOM
日志费用说明 初次使用AOM时,默认为您开通基础版套餐包,该版本包含免费额度,如日志读写流量免费额度为500MB,超过额度的部分将自动按需收费。 AOM中日志相关功能由云日志服务LTS提供,并由LTS统一上报日志、话单,AOM不重复计费。如需停止计费请参见:如何停止日志功能,不再收费?
续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息。 414 Request-URI Too Long 请求的URI过长(URI通常为网址),服务器无法处理。 415 Unsupported Media Type 服务器无法处理请求附带的媒体格式。
Write地址的能力,支持将原生Prometheus的指标通过Remote Write上报到AOM服务端,即可实现时序数据的长期存储。 前提条件 已购买弹性云服务器ECS。 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 配置自建Prometheus数据上报到AOM
(RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM 2.0服务生效。 前提条件 用户已被授予“AOMFullAccessPolicy
ometheus 通用实例实现开源监控系统接入AOM。 应用场景 Prometheus 通用实例类型,适合已经自建了Prometheus服务器,但需要通过远端存储(Remote Write)方式来解决Prometheus存储的可用性和可扩展性场景。 创建Prometheus 通用实例
响应消息头 名称 描述 示例 Date HTTP协议标准报头。表示消息发送的时间,时间的描述格式由rfc822定义。 Mon,12 Nov 2007 15:55:01 GMT Server HTTP协议标准报头。包含了服务器用来处理请求的软件信息。 Apache Content-Length
统计最新时间前1分钟内的主机的网络发送/接收速率在TOP5的主机信息。 最近1小时内的所选主机的网络发送/接收速率的趋势图,趋势图的每一个点分别表示1分钟内所选主机的网络发送/接收速率的值。 趋势图上方的值为所选主机的网络监控的最新时间点主机的网络发送/接收速率的值。 主机监控(CPU&内存)卡片
server { listen 8080; # 根据业务情况进行调整。侦听端口 listen [::]:8080; # 根据业务情况进行调整,ipv6侦听端口 server_name localhost; # 根据业务情况进行调整 location = /stub_status {
该指标用于统计主机本地时间与NTP服务器时间的偏移量,NTP偏移量越接近于0,主机本地时间与NTP服务器时间越接近。 - 毫秒(ms) aom_node_ntp_server_status NTP服务器状态 该指标用于统计主机是否成功连接上NTP服务器。 0、1 0表示已连接 1表示未连接
(RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM服务生效。 前提条件 AOM已在统一身份认证服务IAM为您创建名为“ aom_admin_trust
TopN接口平均响应时间突增:默认对流量Top 5的接口进行检测,基于接口历史3小时数据,判断最近10分钟Top 5接口平均响应时间是否有异常突增点。 应用服务整体错误率突增:基于应用历史3小时数据,判断最近10分钟应用服务整体错误率是否有异常突增点。 TopN接口错误率突增:默认对流量Top 5的接
在“入方向规则”页签下,单击“添加规则”,放通9011端口、源地址为“198.19.128.0/20”的网络流量。 图1 添加入方向规则 单击“验证并保存DMS配置信息”。 选择数据发送topic后,单击“确定”。 数据订阅格式说明 AOM格式的指标JSON格式代码片断 package metric
请求什么类型的操作。 GET:请求服务器返回指定资源。 PUT:请求服务器更新指定资源。 POST:请求服务器新增资源或执行特殊操作。 DELETE:请求服务器删除指定资源,如删除对象等。 HEAD:请求服务器资源头部。 PATCH:请求服务器更新资源的部分内容。当资源不存在的时
事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。 事件根因分析:提供基于应用性能管理APM平台的调用链追踪根因定位技术。可以从应用服务和流量Top N接口的指标、调用链维度,全局分析问题,快速诊断并定位故障根因。