检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
概述 组件设置包括自定义设置、Agent设置以及监控项。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列,某一个组件名称,进入该组件指标项详情页,默认展示
ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息 问题描述 ICAgent安装成功后,AOM无法监控到CPU内存使用率等信息。 原因分析 8149端口未连通。 用户侧节点时间与所在时区当前时间不一致。 解决办法 以root用户登录安装ICAgent的服务器。 执行以下命令
消息队列 消息队列监控项可以对消息队列的访问进行监控,可以监控的消息队列包含KafkaProducer等类型。本章节主要对查看KafkaProducer监控进行介绍 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选
阈值告警最佳实践(新版) 该功能对华北-北京一、华北-北京四、华东-上海一、华东-上海二、华南-广州、西南-贵阳一、中国-香港、华南-深圳、华南-广州-友好用户环境、华北-乌兰察布一、亚太-曼谷和亚太-新加坡区域生效。 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用
ICAgent安装成功后,无法在界面上获取到ICAgent状态 问题描述 ICAgent安装成功后,无法在界面上获取到ICAgent状态。 原因分析 用户侧使用虚拟网卡,想要获取到ICAgent状态信息需要修改下相关脚本规避。 解决办法 以root用户登录已安装ICAgent的CCE
数据库 数据库监控项可以对数据库的访问进行监控,可以监控的数据库包含C3P0连接池、Cassandra、ClickHouse、DBCP、Druid、EsRestClient、GaussDb、Hikari连接池、Jetcd、ObsClient、MySQL、Postgresql、Oracle
Node Exporter接入 node-exporter是Prometheus官方提供的exporter,主要用来采集Linux类型节点的相关信息和运行指标,包括主机的CPU、内存、Load、Filesystem、Network等。通过Node Exporter插件将指标上报到AOM
工作负载监控 工作负载监控是针对CCE、CCI工作负载的监控,通过工作负载监控您可以及时了解工作负载的资源使用、状态和告警等信息,以便快速响应处理告警或事件信息,保证工作负载顺畅运行。工作负载分为五种类型:无状态负载 Deployment、有状态负载 StatefulSet、守护进程
基础指标:node-exporter指标 介绍通过中间件Exporter上报到AOM的node-exporter指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Job名称 指标 指标含义 node-exporter node_filesystem_size_bytes
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的
Web容器 Web容器监控项可以对Web容器的访问进行监控,可以监控的Web容器包含Tomcat等类型。本章节主要对查看Tomcat监控进行介绍。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域
批量操作UniAgent 在主机列表中,可批量对主机的UniAgent进行重装、升级、卸载和删除操作。 如果安装UniAgent的主机是Windows操作系统,则只支持对主机的UniAgent进行升级和删除操作,如需重装和卸载,需手动在主机上执行。 重装UniAgent 当主机的UniAgent
基础指标:虚机指标 介绍通过ICAgent上报到AOM的虚机指标的类别、名称、含义等信息。 表1 虚机指标说明 指标类别 指标 指标名称 指标含义 取值范围 单位 网络指标 aom_node_network_receive_bytes 下行Bps 该指标用于统计测试对象的入方向网络流速
通信协议 通信协议监控项可以对通信协议的访问进行监控,可以监控的通信协议包含Websocket类型。本章节主要对查看Websocket监控进行介绍。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“
数据多写 通过数据多写功能,可以实现跨VPC的访问,而不必暴露服务端相关的网络信息,以更加安全、可靠的方式将监控数据上报到自建Prometheus中。 前提条件 服务已接入ECS类型Prometheus监控,具体请参见Prometheus实例 for ECS。 服务已接入云服务类型
自建Prometheus数据上报到AOM 在default、ECS、CCE、通用实例类型的Prometheus实例的“设置”页签,可以获取当前Prometheus实例的Remote Write地址。将原生Prometheus的指标通过Remote Write上报到AOM服务端,即可实现时序数据的长期存储
创建阈值规则 通过阈值规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 创建方式 阈值规则的创建方式分为两种:自定义阈值规则和使用模板创建阈值规则。一次创建后,只生成一条规则,无论是一个还是多个资源,均通过同一条规则进行监控
搜索日志 当需要通过日志来分析和定位问题时,使用日志搜索功能可帮您快速在海量日志中查询到所需的日志,您还可结合日志的来源信息和上下文原始数据一起辅助定位问题。 在左侧导航栏中选择“日志 > 日志搜索”。 在“日志搜索”页面中选择日志页签(即组件、系统、主机)并按照界面提示设置日志查询条件
创建应用性能监控告警规则 通过创建应用性能监控类型告警规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警。 前提条件 当前仅华东-上海一区域可以直接使用创建应用性能监控告警规则功能,其余区域需提前在“菜单开关”中开启应用监控和配置的开关,详细操作请参见菜单开关。
基础指标:Flink指标 介绍通过Flink服务上报到AOM的指标的类别、名称、含义等信息。 表1 Flink服务监控指标 分类 指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无