检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
场景服务提供准确、及时、一致的资源配置数据。 采集管理:统一管理插件,并为AOM提供指令下发功能,如脚本下发和执行。 开放:支持原生PromQL数据上报,也可通过API等方式上报数据,并也可通过grafana查看数据,通过kafka转储数据。 AOM产品介绍 AOM快速入门 AOM成长地图
1个组件状态图表最多可添加10个组件。 指标 指标数据 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。 指标总量 单租户总指标量不超过40W 小规格总指标量不超过10W 指标项 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。 维度
接入管理 概述 将Prometheus的数据上报到AOM 通过grafana查看AOM中的指标数据 父主题: 配置管理
Prometheus监控 如何将Prometheus数据接入到AOM? 如何区分Prometheus监控功能采集的基础指标和自定义指标数据? 如何获取Prometheus实例的服务地址? 不能废弃以aom_prom_fixed作为前缀的指标
告警。默认只监控一个周期,最多可监控5个周期指标数据。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要启动或者关闭。 默认只监控一个周期,最多可监控5个周期指标数据。 系统处理方式包括:告警、数据不足并发送事件、保持上一个状态、正常。 图1 设置告警条件
示。 设置完成后,监控的指标数据以折线图形式显示在告警条件上方,最多支持展示50条指标数据,单击每条指标数据前的折线符号可将对应指标数据在当前图表中隐藏。单击“新增指标”可多次添加监控指标,并为指标设置统计周期和检测规则等信息。 将光标移动到指标数据和对应告警条件后,还可以根据需要执行以下操作:
1个组件状态图表最多可添加10个组件。 指标 指标数据存储时长 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。 通过ICAgent插件采集指标数据时,采集周期为1分钟,不支持修改。 关联指标项存储时长 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。
义别名和分组对资源进行管理。 仪表盘 通过仪表盘可将不同图表展示到同一个屏幕上,通过不同的仪表形式来展示资源数据,例如,数字图、TopN图表等,进而全面、深入地掌握监控数据。 例如,可将重要资源的关键指标添加到仪表盘中,从而实时地进行监控。还可将不同资源的同一指标展示到同一个图形
通信协议监控项可以对通信协议的访问进行监控,可以监控的通信协议包含Websocket类型。 相关配置请参见查看组件通信协议监控项。 数据库 数据库监控项可以对数据库的访问进行监控,可以监控的数据库包含C3P0连接池、Cassandra、ClickHouse、DBCP、Druid、EsRestClient
集群 集群名称、集群ID、区域。 数据库 关系型数据库RDS - 实例名称/ID、实例类型、数据库引擎版本、资源状态、内网IP、区域、应用环境、操作。 文档数据库DDS - 名称/ID、资源状态、实例类型、版本、企业项目、区域、应用环境、操作。 数据复制服务DRS 实时同步任务 名
建中间件接入AOM。 第三方云厂商或互联网数据中心自建Prometheus对接到AOM Prometheus实例 云上用户经常会遇到多云或者跨region采集自建Prometheus指标数据场景。典型场景例如:将者第三方云厂商或互联网数据中心(Internet Data Cent
根据设置的频率对指标数据查询和分析结果进行检查。 固定间隔 1分钟 告警恢复 连续多少个周期不满足告警条件,恢复告警。 1 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 开启:连续周期“1”达到数据不足,状态设置“数据不足并发送告警”
String 状态 表4 rule字段数据结构说明 参数名称 参数类型 描述 name string 策略名称 conditions 参见表5 匹配条件具体内容。 actions 参见表6 指定策略匹配成功后执行的动作。 表5 conditions字段数据结构说明 参数名称 参数类型 描述
、实例等维度快速过滤。 关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角分析关联指标和告警数据,直击异常。 生态开放 开放了运营、运维数据查询接口和采集标准,支持自主开发。
应用运维管理 应用运维管理(简称AOM)是云上应用的一站式立体化运维管理平台,实时监控应用及云资源,采集各项指标、日志及事件等数据分析应用健康状态,提供告警及数据可视化功能,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况。 了解服务 立即使用 成长地图 由浅入深,带您玩转AOM
ometheus数据采集和数据存储分析的逻辑单元。 Prometheus探针 部署在用户侧或者云产品侧Kubernetes集群。负责自动发现采集目标、采集指标和远程写到其他库。 Exporter 一个采集监控数据并通过Prometheus监控功能规范对外提供数据的组件。目前有上百个官方或者第三方
Bandwidth 表示通过PCIe总线传输/接收的数据速率,包括协议标头和数据有效负载。 该值表示一个时间间隔内的平均值,而不是瞬时值。 该速率在时间间隔内平均。例如,在1秒内传输1 GB数据,则无论以恒定速率还是突发传输数据,速率都是1 GB/s。理论上的最大PCIe Gen3带宽为每通道985
告警相关API,包括新增、更新、删除事件类告警规则等接口。 监控 监控相关API,包括查询指标,查询、添加监控数据等接口。 Prometheus监控 prometheus监控相关API,包括区间数据查询、瞬时数据查询等接口。 日志 日志相关API,包括查询日志接口。 Prometheus实例 Prom
日志搜索与分析(默认推荐) 日志搜索与分析(管道符方式-邀测) 日志应用 日志转储 主机和云服务的日志数据上报至AOM或LTS后,用户可根据需要设置存储时间。超出存储时间的日志数据将会被自动删除,对于需要长期存储的日志数据(日志持久化),通过日志转储功能,可以将日志转储至其他云服务中进行长期保存。 登录AOM
String 状态 表4 rule字段数据结构说明 参数名称 参数类型 描述 name String 策略名称。 conditions 参见表5 匹配条件具体内容。 actions 参见表6 指定策略匹配成功后执行的动作。 表5 conditions字段数据结构说明 参数名称 参数类型 描述