检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查询时间序列 场景描述 本章以查询一个节点的CPU使用率时间序列为例。 涉及的基本信息 查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使
虚机场景Exporter接入 接入概述 MySQL组件接入 Redis组件接入 Kafka组件接入 Nginx组件接入 MongoDB组件接入 Consul组件接入 HAProxy组件接入 PostgreSQL组件接入 Elasticsearch组件接入 RabbitMQ组件接入
用户自定义ServiceMonitor或PodMonitor配置采集指标并上报指标到AOM,产生相关费用。比如容器场景自定义中间件mysql、nginx、业务指标等。 云服务场景 云服务接入AOM Prometheus实例后,部分云服务产生计费。具体如下: 不计费云服务:Modelarts/IotDA/IEF/CSE。
t) 该指标用于统计CCE节点上thinpool元数据空间使用百分比。 0~100 百分比(%) Thin pool 数据空间使用率 (aom_host_diskpartition_thinpool_data_percent) 该指标用于统计CCE节点上thinpool数据空间使用百分比。
查询时序数据 场景描述 本章以查询一个节点的CPU使用率时序数据为例。 涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 因指标格
集群指标及其维度 集群指标由AOM通过主机指标汇聚,汇聚的集群指标不包含master节点的主机指标。 表1 集群指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_cluster_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core)
前提条件 已将ELB日志接入LTS。 业务层接入 通过该功能可获取提取的ELB日志、事务监控或上报的自定义指标,例如用户数、订单数。 登录AOM 2.0控制台。 在左侧导航栏中选择“接入 > 接入中心”。 在右侧“业务层”面板单击需要接入的指标卡片。 单击“基于ELB日志”卡片,在
在CCE中添加日志策略 在CCE中创建工作负载时,添加容器后,展开“容器日志”页签。 单击“添加日志策略”,设置自定义日志参数,配置日志策略,以nginx为例,不同工作负载根据实际情况配置。 图1 添加日志策略 存储类型有“主机路径”和“容器路径”两种类型可供选择: 主机路径:可将主机上的
获取项目ID的接口为“GET https://{Endpoint}/v3/projects/”,其中{Endpoint}为IAM的终端节点,可以从地区和终端节点获取。接口的认证鉴权请参见认证鉴权。 响应示例如下,其中projects下的“id”即为项目ID。 { "projects":
聚指标。 普罗语句语法 普罗语句语法详情可登录prometheus官网查看。 普罗语句查询举例说明 示例一:集群下指定pod占所在节点(不含控制节点)的内存使用率 定义变量: pod中容器内存实际占用量(同一个Pod下可能会有多个容器/实例):aom_container_memory_used_megabytes
云服务监控 类别 云服务名称 计算 函数工作流 FunctionGraph 存储 对象存储服务 OBS 网络 弹性公网IP和带宽、弹性负载均衡 ELB、NAT网关 NAT 数据库 关系型数据库 RDS 应用中间件 分布式消息服务 DMS分布式缓存 DCS 操作步骤 登录AOM 2
使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
文字符组成。 描述 标签的描述信息,最多可输入255个字符。 关联节点 标签要关联的节点。 区域:资源支持的区域,请从下拉列表中选择或输入关键字搜索后选择。 节点:待关联的节点,直接从下面的应用树中选择需要的节点,或输入关键字搜索后选择。 设置完成后,单击“确认”。 更多操作 标
业务监控 不支持 支持基于Prometheus、LTS日志和自定义渠道的业务监控。 应用监控 不支持 支持对JVM、Spring、Nginx、Tengine和Tomcat等的监控。 线下IDC监控 不支持 支持基于Prometheus Exporter的线下硬件、存储和网络等监控。
通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 应用场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过
弹性云服务器 ECS接入 node-exporter是Prometheus官方提供的exporter,主要用来采集Linux类型节点的相关信息和运行指标,包括主机的CPU、内存、Load、Filesystem、Network等。通过Node Exporter插件将指标上报到AOM
元数据空间使用率 该指标用于统计CCE节点上thinpool元数据空间使用百分比。 0~100 百分比(%) aom_host_diskpartition_thinpool_data_percent Thin pool 数据空间使用率 该指标用于统计CCE节点上thinpool数据空间使用百分比。
按集群维度查看当前集群的节点、工作负载、Pod(容器组)和容器信息。 在左侧导航栏选择“洞察 > 节点”,可实时获取到该集群下查看该集群所有主机节点的概况,包括状态、IP地址、Pod状态、CPU使用率和内存使用率等信息。 在节点列表上方,可按节点名称设置过滤条件,实现节点列表过滤显示。
metric name or project ID. 指标名称无效或者项目ID无效 请检查对应的参数是否符合要求。 400 SVCSTG_AMS_4000110 Invalid filled value or limit. 无效的填充值或者限制 请检查对应的参数是否符合要求。 400 SVCSTG_AMS_4000111