检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
安装了ICAgent,但是监控不到主机是什么原因? 问题描述 安装了ICAgent,且节点上ICAgent进程正常,但是无法监控到主机。 可能原因 一般情况下,在AOM页面看不到主机主要有以下几种原因: ICAgent未安装成功 ICAgent安装成功但是配置错误 ICAgent安装成功但是数据采集失败
采集器ICAgent对资源的占用大吗?例如内存、CPU。 AOM对基础指标的采集,包含VM、容器、进程的CPU、内存等基础指标。 资源消耗:对此类指标采集时,采集器ICAgent对资源的消耗和容器、进程个数相关。 正常业务量情况下,采集器ICAgent消耗内存约30M、单核CPU约3%。
常用中间件Exporter接入AOM 操作指导 说明 PostgreSQL Exporter接入AOM实现指标监控 使用PostgreSQL过程中需要对PostgreSQL运行状态进行监控,以便了解PostgreSQL服务是否运行正常,及时排查PostgreSQL故障问题原因。Prometheus监
process_cpu_seconds_total 进程CPU累计时长 process_max_fds 进程最大文件描述符 process_open_fds 进程当前打开的文件描述符 process_resident_memory_bytes 进程常驻内存集的大小 process_start_time_seconds
统一接入中心:提供全场景数据接入能力,支持业务层(安卓、IOS、WEB等)、组件层(JAVA、GO等多语言)、中间件层(Redis、MySQL等)、运行环境层(ECS、K8s等)、云服务层、API和开源协议(OpenTelemetry、Kafka等)各种方式接入指标、链路、日志
)、设备接入服务(IoTDA)、ModelArts、MapReduce服务(MRS)、云数据库(RDS for MySQL)、云数据库(RDS for PostgreSQL)、云数据库(RDS for SQL Server)、应用与数据集成平台(ROMA Connect)、视频直
概览 url调用次数 URL的调用次数。 url平均响应时间 URL在采集周期内的平均响应时间。 url错误率 URL的错误率。 mysql错误率 MySQL的错误率。 redis错误率 Redis的错误率。 httpclient调用次数 HttpClient的调用次数。 httpclient平均响应时间
功能介绍 日志升级 日志升级后,容器日志和虚机日志均接入AOM 2.0,历史虚机日志可登录AOM 1.0查看。 采集器升级 采集器升级后,进程发现能力增强,并且可自动适配指标浏览服务相关功能。 告警规则升级 告警规则升级后,告警规则相关数据从1.0平滑切换至2.0,并可自动适配AOM
控制台,在“实例管理”界面实例列表中单击一个RDS实例名。在“基本信息”界面查看RDS安全组。 图3 查看RDS安全组 检查RDS的安全组是否已开放3306端口。 图4 检查RDS端口是否开放 执行以下命令,进入解压文件夹,并在ECS服务器上配置mysql.cnf文件。 cd mysqld_exporter-0
功能介绍 日志升级 日志升级后,容器日志和虚机日志均接入AOM 2.0,历史虚机日志可登录AOM 1.0查看。 采集器升级 采集器升级后,进程发现能力增强,并且可自动适配指标浏览服务相关功能。 告警规则升级 告警规则升级后,告警规则相关数据从1.0平滑切换至2.0,并可自动适配AOM
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态
)、设备接入服务(IoTDA)、ModelArts、MapReduce服务(MRS)、云数据库(RDS for MySQL)、云数据库(RDS for PostgreSQL)、云数据库(RDS for SQL Server)、应用与数据集成平台(ROMA Connect)、视频直
使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
告警抑制规则功能可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警;或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
NAT、企业路由器 ER、分布式消息服务 DMS、分布式缓存 DCS、专享版API网关 APIG、云数据库 GaussDB(for MySQL)、云数据库 GeminiDB、关系型数据库 RDS、文档数据库服务 DDS、数据复制服务 DRS、AI平台 ModelArts、湖仓构建 LakeFormation、表格存储服务
息和显卡、网卡等常用系统设备信息。 在ECS主机的“进程列表”页签下,可查看该主机的进程状态、IP地址等信息。 在进程列表右上角的搜索框可按进程名称等设置搜索条件,实现进程过滤显示。 单击右上角的,可获取到设置的时间范围内进程的最新信息。 在CCE主机的“Pod实例”页签下,可查看实例状态、节点IP等信息。
统计当前实例/资源空间下MQTT流转失败次数 ≥0 次 MySql流转次数 iotda_mysql_forwarding_totalCount MySql流转次数 统计当前实例/资源空间下MySql流转次数 ≥0 次 iotda_mysql_forwarding_successCount MySql流转成功次数 统计
关闭 用户自定义ServiceMonitor或PodMonitor配置采集指标并上报指标到AOM,产生相关费用。比如容器场景自定义中间件mysql、nginx、业务指标等。 云服务场景 云服务接入AOM Prometheus实例后,部分云服务产生计费。具体如下: 不计费云服务:Mo
采集频率为1分钟1次。除了CPU使用率等指标外,还可以支持内存使用率(Linux)等指标,详见云产品监控指标。 进程监控 针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。 登录AOM 2.0控制台。 在左侧导航栏中选择“云服务监控 > 云主机监控
可能原因二:AOM不支持监控当前资源类型 修复建议:请检查您的资源是否为AOM监控的类型,AOM当前支持监控的资源类型有:主机、K8s容器、用户进程(AOM不监控主机的系统进程)。 可能原因三:资源被删除或被停止 修复建议: 在ECS界面检查主机是否已被重启、关机或删除。 在CCE界面检查服务是否已被停止或删除。