检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
集群指标及其维度 集群指标由AOM通过主机指标汇聚,汇聚的集群指标不包含master节点的主机指标。 表1 集群指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_cluster_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core)
参数 说明 nginx地址 Nginx地址。格式:Nginx 服务的连接地址+Nginx服务的服务状态路径。 Nginx服务的连接地址:Nginx服务的IP地址和侦听端口号。其中nginx.conf配置文件中指定了侦听端口。例如:10.0.0.1:8080。 Nginx服务的服务状态路径:由nginx
参数 说明 nginx地址 Nginx地址。格式:Nginx 服务的连接地址+Nginx服务的服务状态路径。 Nginx服务的连接地址:Nginx服务的IP地址和侦听端口号。其中nginx.conf配置文件中指定了侦听端口。例如:10.0.0.1:8080。 Nginx服务的服务状态路径:由nginx
确认stub_status模块启用之后,在nginx.conf配置文件中添加如下配置(nginx.conf配置文件一般在/usr/local/nginx/conf目录下)。示例如下: 执行如下命令在vi编辑器中打开nginx.conf配置文件: vi /usr/local/nginx/conf/nginx.conf
通过AOM监控集群 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。
配置CCE集群监控采集指标规则 AOM支持通过新增ServiceMonitor或PodMonitor的方式为应用配置可观测监控 Prometheus 版的采集规则,来监控部署在CCE集群内的应用的业务数据。 前提条件 服务已接入CCE类型Prometheus 监控,并接入CCE集群,具体请参见Prometheus实例
对应的集群和命名空间,左边的列表展示了在已选命名空间下该集群的组件,单击某个组件,即可查看其日志文件,如下图所示。详细操作请参见查看日志文件。 图3 查看容器服务日志文件 查看容器服务日志并进行分析 在左侧导航栏中选择“日志 > 日志搜索”,在“组件”页签中选择对应的集群与命名空
在“指标管理”页面的“指标”页签下,选择对应集群。 选择Job:{namespace}/elasticsearch-exporter,可以查询到elasticsearch开头的自定义指标。 在AOM上配置仪表盘和告警 通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。
图1 查看集群接入信息 根据需要,选择需要接入的集群,单击该集群右侧的“一键安装”,为集群安装云原生监控插件。 图2 接入CCE集群 等待安装成功,单击“关闭”即可接入该CCE集群,并将集群关联到当前Prometheus实例。 单击“取消安装”,可取消对应CCE集群的接入。 父主题:
置 > CCE集群管理”。 查看已接入的CCE集群。 可根据集群名称,在搜索框中搜索集群。 管理CCE集群的ICAgent插件 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。当前仅华南-广州区域的菜单路径为:在左侧导航栏选择“全局设置”,进入全局设置页面。
置 > CCE集群管理”。 查看已接入的CCE集群。 可根据集群名称,在搜索框中搜索集群。 管理CCE集群的ICAgent插件 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。当前仅华南-广州区域的菜单路径为:在左侧导航栏选择“全局设置”,进入全局设置页面。
自启动以来处于接受、已处理状态,每种状态各自的客户端连接数 nginx_ingress_controller_nginx_process_cpu_seconds_total Nginx进程消耗的CPU时间总量(以秒为单位) nginx_ingress_controller_nginx_process_num_procs
作请参见: Kafka日志接入(LTS) Kafka指标接入(AOM) NGINX 高性能HTTP/反向代理服务器,支持5万并发,稳定且内存消耗低。具体操作请参见: NGINX日志接入(LTS) Nginx指标接入(AOM) MongoDB 高性能、开源的NoSQL数据库,支持文
e)、内容分发网络(CDN)、云搜索服务(CSS)、云专线(DC)、分布式缓存服务(DCS)、文档数据库服务(DDS)、数据湖探索(DLI)、分布式消息服务Kafka版(DMS)、数据复制服务(DRS)、数据仓库服务(DWS)、弹性负载均衡(ELB)、企业路由器(ER)、云硬盘(
Prometheus 中间件接入 MySQL 指标 中间件接入AOM Redis Kafka Nginx MongoDB Consul HAProxy PostgreSQL Elasticsearch RabbitMQ 其他组件(Custom Exporter) Prometheus 运行环境接入
Redis指标接入AOM Kafka指标接入AOM Nginx指标接入AOM MongoDB指标接入AOM Consul指标接入AOM HAProxy指标接入AOM PostgreSQL指标接入AOM Elasticsearch指标接入AOM RabbitMQ指标接入AOM 其他中间件指标接入AOM
Redis指标接入AOM Kafka指标接入AOM Nginx指标接入AOM MongoDB指标接入AOM Consul指标接入AOM HAProxy指标接入AOM PostgreSQL指标接入AOM Elasticsearch指标接入AOM RabbitMQ指标接入AOM 管理中间件采集任务
单击“Kafka”卡片,在弹出页面接入Kafka Exporter。具体操作请参见:Kafka指标接入AOM。 Nginx 单击“Nginx”卡片,在弹出页面接入Nginx Exporter。具体操作请参见:Nginx指标接入AOM。 MongoDB 单击“MySQL”卡片,在弹出页面接入MongoDB
接入Prometheus后,为什么会产生额外费用? CCE容器场景 通常情况下,用户购买CCE集群,部署工作负载之后,默认会采集cluster、Pod、Container、Node等基础指标-容器指标,基础指标的上报不产生费用。 产生计费的可能原因是: Prometheus实例内
查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使用率metric_name可以在主机指标中查看,集群ID和节点ID各自对应的name可以