-
Prometheus监控概述 - 应用运维管理 AOM
务的监控数据的场景。 Prometheus实例 for Remote Write 自建的Prometheus 提供Prometheus时序数据库的远端存储。 提供自研监控大盘进行数据的展示。 说明: 由于Prometheus服务器为用户自己运维,所以相应的服务发现、数据采集等需用户自行配置。
-
资源监控 - 应用运维管理 AOM
支持的操作系统,且主机已安装ICAgent,即可将主机接入到AOM中进行监控。 日志 AOM提供了海量运行日志的检索和分析功能,支持日志采集、下载、转储、搜索,并提供报表分析、SQL查询、实时监控、关键词告警等能力。 AOM的基础版和按需版所对应的日志存储时长、大小和计费方式不同,详见收费详情。
-
文件系统指标及其维度 - 应用运维管理 AOM
兆字节(MB) 磁盘读写状态(aom_node_disk_rw_status) 该指标用于统计主机上磁盘的读写状态。 0、1 0表示读写 1表示只读 无 磁盘使用率(aom_node_disk_usage) 已使用的磁盘空间占总的磁盘空间容量百分比。 0~100 百分比(%) 表2 文件系统指标维度
-
通过Remote Read方式读取Prometheus实例数据 - 应用运维管理 AOM
Read方式读取Prometheus实例数据 Prometheus监控提供了Remote read接口,该接口支持将一系列Prometheus协议的数据源组织为单一数据源查询。本文介绍如何使用自建Prometheus,通过Remote read接口读取AOM Prometheus实例的数据。 前提条件 服务已接入可观测Prometheus
-
产品架构 - 应用运维管理 AOM
用Kafka高吞吐的能力,实时将数据传输给业务计算层。 数据存储:运维数据经过AOM后端服务的处理,将数据写入到数据库中,其中Cassandra用来存储数据,Redis用来查询缓存,ETCD用来存储AOM的配置数据,ElasticSearch用来存储资源、日志、告警和事件。 业务计算层
-
日志设置 - 应用运维管理 AOM
单击“分词配置”页签。 登录LTS控制台。 在左侧导航栏选择“配置中心”。 单击“分词配置”页签。 分词配置 ICAgent采集 为了减少内存、数据库和磁盘空间占用,您可以按需进行ICAgent采集设置。 登录AOM 2.0控制台。 在左侧导航栏选择“设置 > 日志设置”。 单击“ICAgent采集开关”页签。
-
约束与限制 - 应用运维管理 AOM
1个组件状态图表最多可添加10个组件。 指标 指标数据 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。 指标总量 单租户总指标量不超过40W 小规格总指标量不超过10W 指标项 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。 维度
-
仪表盘 - 应用运维管理 AOM
自动退出到登录界面,可持续在全屏模式下进行监控。 轮播周期:开启仪表盘轮播才需设置对应的“轮播周期”和“仪表盘”信息。取值范围:10~120秒,默认轮播周期为10秒。 单击“确认”,进入仪表盘全屏模式。 设置插值方式 单击“插值方式”,将指标数据按照所设置的插值方式进行聚合。当指
-
权限管理 - 应用运维管理 AOM
Administrator、OBS Administrator、LTS FullAccess AOM ReadOnlyAccess AOM只读权限,拥有该权限的用户仅能查看AOM数据。 系统策略 表2列出了AOM常用操作与系统权限的授权关系,您可以参照该表选择合适的系统权限。 表2 常用操作与系统权限的关系
-
指标浏览 - 应用运维管理 AOM
指标浏览 指标浏览展示了各资源的指标数据,您可实时监控指标值及趋势,还可对关注的指标进行创建阈值规则等操作,以便实时查看业务及分析数据关联分析。 监控指标 在左侧导航栏中选择“监控 > 指标浏览”。 选择指标: 华北-北京一、华北-北京四、华东-上海一、华东-上海二、华南-广州、
-
普罗语句说明 - 应用运维管理 AOM
普罗语句说明 AOM对接了PromQL(Prometheus Query Language)语言,该语言内置了丰富的函数,用户可使用该内置函数对指标数据筛选和聚合。 按普罗语句添加指标时,用户可通过普罗语句自定义汇聚指标。 普罗语句语法 普罗语句语法详情可登录prometheus官网查看。
-
AOM有哪些使用限制? - 应用运维管理 AOM
1个组件状态图表最多可添加10个组件。 指标 指标数据 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。 指标总量 单租户总指标量不超过40W 小规格总指标量不超过10W 指标项 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。 维度
-
应用管理的使用说明 - 应用运维管理 AOM
应用管理的使用说明 应用管理用于管理云服务对象与应用之间的关系,遵循“应用 + 子应用(可选)+ 组件 + 环境”的应用管理模型,主要用于管理ECS、RDS和ELB等云服务资源。 图1 应用管理模型 父主题: 应用管理
-
创建仪表盘 - 应用运维管理 AOM
选择“全屏”,可全屏显示图表数据。 退出全屏显示单个图表 将光标移至屏幕上方,单击弹出的,或者单击,选择“退出全屏”,或者按键盘中的“Esc”可退出全屏模式。 轮播仪表盘 选择待操作的仪表盘,在“仪表盘”页面右上角单击。具体操作请参见设置全屏模式在线时长。 仪表盘设置 选择待操
-
接入中心总览 - 应用运维管理 AOM
DC、NAT网关 NAT、分布式消息服务 DMS、分布式缓存 DCS、关系型数据库 RDS、文档数据库服务 DDS、数据复制服务 DRS、湖仓构建 LakeFormation、云原生数据湖 MRS、数据仓库服务 GaussDB DWS、云搜索服务 CSS、Web应用防火墙 WAF)指标的详细描述请参见云服务指标说明。
-
权限管理 - 应用运维管理 AOM
ReadOnlyAccess AOM2.0只读权限,拥有该权限的用户仅能查看AOM数据。 系统策略 自动化运维 CMS FullAccess 自动化运维管理员权限,拥有该权限的用户可以操作并使用自动化运维。 系统策略 - CMS ReadOnlyAccess 自动化运维只读权限,拥有该权限的用户仅能查看自动化运维数据。
-
配置容器服务日志采集路径 - 应用运维管理 AOM
AOM的日志绕接能力是使用copytruncate方式实现的,如果选择了设置,请务必保证您写日志文件的方式是append(追加模式),否则可能出现文件空洞问题。 当前主流的日志组件例如Log4j、Logback等均已经具备日志文件的绕接能力,如果您的日志文件已经实现了绕接能力,则无需设置。否则可能出现冲突。
-
概述 - 应用运维管理 AOM
通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件,以便您在第一时间发现异常并进行处理。 告警通知 AOM提供了告警通知功能,您可通过创建通知规则、告警行动规则或告
-
PostgreSQL组件接入 - 应用运维管理 AOM
Exporter可以采集监控数据并通过Prometheus监控规范对外提供数据。 图2 安装Exporter 参数 说明 PostgreSQL用户名 PostgreSQL的用户名称。 PostgreSQL密码 PostgreSQL的密码。 PostgreSQL地址 PostgreSQL的IP地址和端口号,例如:10
-
ElasticSearch Exporter接入 - 应用运维管理 AOM
使用ElasticSearch过程中需要对ElasticSearch运行状态进行监控,例如集群及索引状态等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控ElasticSearch运行状态。本文介绍如何部署ElasticSearch Exporter以及实现ElasticSearch