应用运维管理 AOM-Prometheus监控概述

时间:2024-09-03 15:55:08

Prometheus监控概述

Prometheus监控全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘和全面托管的Prometheus服务。

Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、灵活查询语句PromQL以及 数据可视化 展示等。更多信息请参见Prometheus官方文档

Prometheus实例

Prometheus实例是 AOM 服务提供的管理Prometheus数据采集和数据存储分析的逻辑单元。根据Prometheus监控的对象和使用场景,Prometheus实例可以分为以下几种类型,具体请参见表1

表1 Prometheus实例说明

Prometheus实例类型

监控对象

监控能力

应用场景

default

  • 通过添加监控数据API上报的指标。
  • IoTDA、ModelArts、IEF、CCI等API上报的云服务指标。
  • 通过ICAgent采集上报的指标。

提供通过API和ICAgent上报到AOM的指标的监控。

通用Prometheus实例,不区分使用场景,既适合作为自建Prometheus 的远程存储(Remote Write)场景,也适合接入容器、云服务、主机等指标数据的场景。

Prometheus实例 for CCE

CCE

  • 提供与容器服务原生的集成能力、容器指标的监控能力。
  • 默认开启以下服务发现能力:Kubernetes SD、 ServiceMonitor、PodMonitor的自定义发现。

适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。

Prometheus实例 for E CS

ECS

  • 通过在VPC内的某台虚机上安装uniagent(Exporter)插件提供针对此VPC内ECS应用和组件(如数据库,中间件等)的一体化监控。

适合需要对运行在华为云的 虚拟私有云VPC 内(通常为弹性 云服务器ECS 集群)的应用组件进行监控场景,可以通过接入中心添加Prometheus中间件监控。

Prometheus实例 for 云服务

多种云服务

提供多种云服务的监控。
说明:

一个企业项目下只支持创建一个“Prometheus for 云服务”类型的Prometheus实例。

适合需要通过Prometheus监控来统一采集、存储和显示云服务的监控数据的场景。

Prometheus实例 通用实例

自建的Prometheus

  • 提供Prometheus 时序数据库 的远端存储。
  • 提供自研监控大盘进行数据的展示。
    说明:

    由于Prometheus服务器为用户自己运维,所以相应的指标管理、数据采集等需用户自行配置。

适合已经自建了Prometheus Server,但需要通过远端存储(Remote Write)方式来解决数据存储问题的可用性和可扩展性场景。

Prometheus实例 for 多账号聚合实例

同一个组织下多账号的云服务资源、CCE资源和ECS资源

支持对同一个组织下多账号的云服务资源、CCE、ECS数据聚合,运维监控。

说明:

通过该Prometheus实例接入的

适合需要统一监控同一个组织下多成员账号的云服务资源、CCE资源、ECS资源的场景。

support.huaweicloud.com/usermanual-aom2/mon_01_0083.html