检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Exporter接入AOM实现指标监控 使用PostgreSQL过程中需要对PostgreSQL运行状态进行监控,以便了解PostgreSQL服务是否运行正常,及时排查PostgreSQL故障问题原因。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控PostgreS
Engine,CSE)等上层运维服务采集指标数据并实时、可视化呈现。 可观测性分析 基于四层指标体系(基础设施层指标、中间件层指标、应用层指标和业务层指标),通过事务监控、容器监控、普罗监控等功能,提供异常检测、历史数据分析、性能分析、关联性和场景化分析等可观测性分析能力。 运维自动化 提供批量磁盘清理、作业编排、脚
件的状态信息分别置于同一图表中进行监控。 阈值状态图表:实时监控阈值规则的状态。 图3 阈值状态图表 添加阈值状态图表前请先创建阈值规则,否则将无法添加阈值状态图表。 主机状态图表:实时监控主机的状态。 图4 主机状态图表 组件状态图表:实时监控组件的状态。 图5 组件状态图表 资源TopN图表
通过新增ServiceMonitor或PodMonitor的方式为应用配置可观测监控 Prometheus 版的采集规则,来监控部署在CCE集群内的应用的业务数据。 前提条件 服务已接入CCE类型Prometheus 监控并接入CCE集群,具体请参见Prometheus实例 for CCE。
在左侧导航栏选择“Prometheus监控 > 实例列表”,在实例列表中查看已创建的Prometheus实例,并可根据需要执行以下操作,具体请参见表1。 图1 管理Prometheus实例 表1 相关操作 操作 说明 搜索Prometheus实例 输入实例名称,单击,快速搜索待监控的Prometheus实例。
>= dimensions 是 Array of Dimension objects 时间序列维度列表。可通过调用查询时间序列接口,查询当前监控的时间序列名称的时间序列维度列表。 evaluation_periods 是 Integer 间隔周期。 is_turn_on 否 Boolean
>= dimensions 是 Array of Dimension objects 时间序列维度列表。可通过调用查询时间序列接口中,查询当前监控的时间序列名称的时间序列维度列表。 evaluation_periods 是 Integer 间隔周期。 最小值:1 最大值:5 is_turn_on
503 ServiceUnavailable 被请求的服务无效。建议直接修改该请求,不要重试该请求。 错误码 请参见错误码。 父主题: 监控
Unauthorized 在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。 错误码 请参见错误码。 父主题: 监控
指标 需要监控的指标。单击“指标”文本框,通过下列框右侧的资源树,可以按资源类型快速选择需监控的指标。 aom_container_cpu_usage 统计周期 指标数据按照所设置的统计周期进行聚合。 1分钟 条件 指标监控的维度。不设置则表示选中全部资源。此处根据3中监控的工作负载设置条件。
Prometheus实例 for CCE Prometheus 通用实例 Prometheus实例 for 多账号聚合实例 父主题: Prometheus监控
告警降噪 概述 创建分组规则 创建抑制规则 创建静默规则 父主题: 告警管理
建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 实践场景 用户体验至上的互联网时代,页面的响应速度、访问时延和页面的访问成功率常常会影响用户的体验,如果无法及时获知,就会导致流失大量用户,某商城的运维
中的JAVA应用安装Agent来监控JAVA应用。 监控Node.js应用:AOM支持通过快速接入Agent或手动接入Agent来监控Node.js应用。 监控JAVA应用(快速接入Agent) AOM提供应用接入功能,通过快速接入Agent来监控JAVA应用。 Java语言支持
AOM与CES的云服务监控功能对比 本章节主要对比AOM 2.0的云服务监控与CES的云服务监控功能差异。 AOM的指标数据来源于CES。AOM的指标数据为Prometheus格式,CES为自定义格式。AOM与CES的云服务监控功能对比如表1所示。 表1 AOM的云服务监控与CES的云服务监控功能对比
实时采集应用性能相关的数据。您可以管理APM探针启停状态。 管理APM探针启停状态。 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 探针管理”,进入探针管理页面。 设置搜索条件,筛选出满足搜索条件的Agent。支持按照“应用”、“组件”、“环境”、“IP”或“主机名”条件进行筛选。
503 ServiceUnavailable 被请求的服务无效。建议直接修改该请求,不要重试该请求。 错误码 请参见错误码。 父主题: 监控
展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 功能入口 登录AOM 2.0控制台。 在菜单栏选择“监控中心”,进入“监控中心”界面。 左侧导航栏单击“智能洞察(BETA)”。 在页面右上角设置应用的时间范围。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义
前提条件 服务已接入CCE类型Prometheus 监控并接入CCE集群,具体请参见Prometheus实例 for CCE。 配置Recording Rule 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”。 在Prometheus实例列表
一个条件则触发告警。 多指标 指标 需要监控的指标。单击“指标”文本框,通过下拉框右侧的资源树,可以按资源类型快速选择需监控的指标。 node_network_up 统计周期 指标数据按照所设置的统计周期进行聚合。 1分钟 条件 指标监控的维度。不设置则表示选中全部资源。本示例可不填写。