检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过Remote Read方式读取Prometheus实例数据 Prometheus监控提供了Remote read接口,该接口支持将一系列Prometheus协议的数据源组织为单一数据源查询。本文介绍如何使用自建Prometheus,通过Remote read接口读取AOM Prometheus实例的数据。
基本概念 本文汇总使用Prometheus监控过程中涉及的基本概念,方便您查询和了解相关概念。 表1 基本概念 概念 说明 Exporter 一个采集监控数据并通过Prometheus监控功能规范对外提供数据的组件。目前有上百个官方或者第三方 Exporter可供使用,具体请参见Exporter详情。
弹性云服务器ECS接入 Node Exporter是Prometheus的开源指标数据收集插件,负责从目标Jobs收集数据,并把收集到的数据转换为Prometheus支持的时序数据格式。通过接入弹性云服务器ECS,您可以为主机组安装Node Exporter并配置采集任务,采集到
概述 本功能当前在华北-北京一、华北-北京四、华东-上海一、华东-上海二、华南-广州、西南-贵阳一、中国-香港、华南-深圳、华南-广州-友好用户环境、华北-乌兰察布一、亚太-曼谷和亚太-新加坡区域开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 AOM提供告警降噪功能,
主机指标及其维度 表1 主机指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_node_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_node_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。
组件监控 组件即您部署的服务,包括容器和普通进程。 组件列表展示了每个组件的名称、运行状态、所属应用等信息。AOM支持从组件下钻到实例,从实例下钻到进程。通过各层状态,您可完成对组件的立体监控。 组件监控 登录AOM 2.0控制台。 在左侧导航栏中选择“基础设施监控 > 进程监控
创建应用性能监控告警规则 通过创建应用性能监控类型告警规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警。 前提条件 当前仅华东-上海一区域可以直接使用创建应用性能监控告警规则功能,其余区域需提前在“菜单开关”中开启应用监控和配置的开关,详细操作请参见菜单开关。
调用链 在企业微服务之间调用复杂的场景下,Agent会抽样一些请求,拦截对应请求及后续一系列的调用信息。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 调用链”,进入调用链页面。 图1 查看调用链 在查询条件下输入查询条件查询具体的调用链列表,详细请参见表1,也可在界面下方新增自定义查询条件。
Kafka Exporter接入 操作场景 使用Kafka过程中需要对Kafka运行状态进行监控,例如集群状态、消息消费情况是否有积压等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Kafka运行状态。本文介绍如何部署Kafka Exporter以及实现Kafka
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态
脚本管理 “脚本管理”页面展示现有的所有脚本信息。您可以在这里创建脚本,也可以修改、复制已创建的脚本。创建完成后,可以为脚本新建执行任务,也可创建任务后在任务管理中执行并查看。每个脚本支持最多创建20个版本,单用户支持创建的所有脚本的版本合计最多1000个。 创建脚本 登录AOM
Kafka Exporter接入 操作场景 使用Kafka过程中需要对Kafka运行状态进行监控,例如集群状态、消息消费情况是否有积压等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Kafka运行状态。本文介绍如何部署Kafka Exporter以及实现Kafka
自定义插件接入 操作场景 您可以使用自定义插件创建采集任务,监控用户指定的相关指标,并通过Exporter上报数据库指标,用于异常报警和Grafana监控大盘展示。 前提条件 主机已安装UniAgent。 已创建ECS Prometheus实例。 已创建自定义插件。 创建自定义插件
创建消息模板 AOM提供消息模板功能,可通过创建消息模板自定义配置通知消息,当AOM触发已设定的告警通知策略时,可通过此功能以您自定义消息模板的邮件、短信、飞书、企业微信、钉钉、语音、welink、HTTP或HTTPS形式通知指定的人员。如果您未创建任何消息模板,则采用默认消息模板。
将AOM仪表盘详情页面嵌入用户自建系统 AOM支持将仪表盘详情页界面嵌入到客户自建系统。通过统一身份认证服务IAM的联邦代理机制实现用户自定义身份代理,再将登录链接嵌入至客户自建系统实现无需在华为云官网登录就可在自建系统界面查看AOM仪表盘详情页。 应用场景 该功能主要用于用户可
查看告警 告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。“告警列表”页面提供告警查询和处理功能,便于您更快地发现、定位并恢复故障。 功能介绍 在告警列表中,有以下关键功能:
快速监控云容器引擎 CCE的指标 云容器引擎 CCE是一个企业级的集群托管服务,基于云服务器快速构建高可靠的容器集群,帮助您轻松创建和管理多样化的容器工作负载。应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运
快速管理应用 本章节介绍在“总览”页面的应用视角下,如何通过AOM快速管理应用,包括应用创建到发现、监控等操作。主要操作如下: 创建应用:通过CMDB创建应用和资源关系树,在应用所在主机安装采集器。 配置告警:创建指标告警规则,应用异常时发送通知。 配置告警行动规则:配置告警处理策略,如应用异常时自动重启。
创建日志指标规则(新版) 支持创建日志指标规则,将上报到LTS的日志数据提取为指标来统一管理,便于后续在指标浏览、仪表盘界面实时监控。 注意事项 单个用户最多可创建100个日志指标规则,所有规则中添加的指标总数不能超过100。 前提条件 已将日志接入LTS。 创建日志指标规则 登录AOM
阈值告警最佳实践(新版) 该功能对华北-北京一、华北-北京四、华东-上海一、华东-上海二、华南-广州、西南-贵阳一、中国-香港、华南-深圳、华南-广州-友好用户环境、华北-乌兰察布一、亚太-曼谷和亚太-新加坡区域生效。 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着