检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
集群监控 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。 注意事项
图2 安装Exporter 参数 说明 MySQL用户名 MySQL的用户名称。 MySQL密码 MySQL的密码。 MySQL地址 MySQL的IP地址和端口号,例如:10.0.0.1:3306。 单击“立即创建”,即可完成MySQL插件接入。已接入的插件会显示在采集任务页面
MySQL Exporter接入 操作场景 MySQL Exporter专门为采集MySQL数据库监控指标而设计开发,通过Exporter上报核心的数据库指标,用于异常报警和监控大盘展示。目前,Exporter支持5.6版本或以上版本的MySQL。在MySQL低于5.6版本时,部分监控指标可能无法被采集。
MySQL Exporter接入 操作场景 MySQL Exporter专门为采集MySQL数据库监控指标而设计开发,通过Exporter上报核心的数据库指标,用于异常报警和监控大盘展示。目前,Exporter支持5.6版本或以上版本的MySQL。在MySQL低于5.6版本时,部分监控指标可能无法被采集。
集群指标及其维度 集群指标由AOM通过主机指标汇聚,汇聚的集群指标不包含master节点的主机指标。 表1 集群指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_cluster_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core)
配置CCE集群指标管理 通过新增ServiceMonitor或PodMonitor的方式为应用配置可观测监控 Prometheus 版的采集规则,来监控部署在CCE集群内的应用的业务数据。 前提条件 服务已接入CCE类型Prometheus 监控并接入CCE集群,具体请参见Prometheus实例
数据库 数据库监控项可以对数据库的访问进行监控,可以监控的数据库包含C3P0连接池、Cassandra、ClickHouse、DBCP、Druid、EsRestClient、GaussDb、Hikari连接池、Jetcd、ObsClient、MySQL、Postgresql、Or
应用洞察下的应用监控和进程监控下的应用监控有什么区别? AOM 2.0控制台中存在两个“应用监控”功能,入口不同,对应的功能也不同。 入口为:“应用洞察 > 应用监控” 主要监控用户通过应用资源管理功能统一管理的所有资源对象与应用,通过该应用监控可以及时了解应用的资源使用、状态和告警等信息,以便快速响应,保证系统顺畅运行。
AOM与APM有何区别? AOM与APM同属于立体化运维解决方案体系,共享采集器。AOM提供了应用级故障分析、告警管理、日志采集与分析等能力,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。APM提供了用户体验管理、分布式性能追踪、事务分析等能力,可以帮助运维
注意事项 一个主机最多可添加5个标签,且标签键不能重复。 不同主机可添加同一个标签。 通过创建CCE、ServiceStage集群时创建的主机,不支持添加自定义集群和别名。 主机状态包含“正常”、“异常”、“亚健康”、“通道静默”、“已删除”。当由于网络异常、主机下电、关机等原因导致的
例,介绍了命名空间、维度和指标的关系。 图1 集群指标 AOM的基础版和按需版所对应的指标存储时长及计费方式不同,详见收费详情。 主机 AOM的每一台主机对应一台虚拟机或物理机。主机可以是您自己的虚拟机或物理机,也可以是您通过华为云购买的虚拟机(例如:弹性云服务器,简称ECS)或
AOM的日志服务与LTS的日志服务有何区别? AOM作为华为云服务可观测性分析统一入口,自身并不具有日志服务功能,AOM中日志相关功能由云日志服务LTS提供,并由LTS统一上报日志、话单,AOM不重复计费。如需停止计费请参见:如何停止日志功能,不再收费? 父主题: 其他常见问题
查看已接入的CCE集群。可根据集群名称,在搜索框中搜索集群。 执行ICAgent操作 您可以对已接入的CCE集群中的主机进行ICAgent插件的安装、升级和卸载。 安装ICAgent:当集群中的主机未安装ICAgent时,可以对所有主机安装ICAgent。 在集群名称中,选择待执行
查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使用率metric_name可以在主机指标中查看,集群ID和节点ID各自对应的name可以在
orage_shards 当前用于并行发送到远程存储的分片数 prometheus_remote_storage_shards_desired 分片队列期望基于输入样本和输出样本的比率运行的分片数 prometheus_remote_storage_shards_max 可用于并行发送到远程存储的分片数的最大值
态和采集状态。 图1 查看集群接入信息 根据需要,选择需要接入的集群,单击该集群右侧的“一键安装”,为集群安装Prometheus插件。 图2 接入CCE集群 等待安装成功,单击“关闭”即可接入该CCE集群,并将集群关联到当前Prometheus实例。 单击“取消安装”,可取消对应CCE集群的接入。
PostgreSQL Exporter接入 操作场景 使用PostgreSQL过程中需要对PostgreSQL运行状态进行监控,以便了解PostgreSQL服务是否运行正常,及时排查PostgreSQL故障问题原因。Prometheus监控服务提供了CCE容器场景下基于Expor
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]