检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置CCE集群监控采集指标规则 AOM支持通过新增ServiceMonitor或PodMonitor的方式为应用配置可观测监控 Prometheus 版的采集规则,来监控部署在CCE集群内的应用的业务数据。 前提条件 服务已接入CCE类型Prometheus 监控,并接入CCE集群,具体请参见Prometheus实例
资源监控使用说明 满足内置发现规则的服务,安装ICAgent后该服务会自动被发现;对于不满足内置应用发现规则的服务,您则需配置应用发现规则。 资源监控使用说明如下: 图1 资源监控使用说明 父主题: 资源监控
分区名称,可在“监控视图”页面监控该磁盘分区的各种指标。 在“网卡”页签下,在列表中可查看该主机网卡的基本信息,单击网卡名称,可在“监控视图”页面监控该网卡的各种指标。 在“显卡”页签下,在列表中可查看该主机显卡的基本信息,单击显卡名称,可在“监控视图”页面监控该显卡的各种指标。
配置数据多写实现监控指标转储到自建Prometheus 通过数据多写功能,可以实现跨VPC的访问,而不必暴露服务端相关的网络信息,以更加安全、可靠的方式将监控数据上报到自建Prometheus中。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。
应用监控 应用洞察下的应用监控和进程监控下的应用监控有什么区别?
监控组件性能指标 设置组件监控开关 查看组件性能指标 通过拓扑图查看组件间调用关系 通过Profiler分析代码性能 通过Debugging诊断代码 查看组件接口调用监控项 查看组件基础监控项 查看组件异常日志 查看组件外部调用监控项 查看组件通信协议监控项 查看组件数据库监控项
通过AOM监控进程 配置AOM应用发现规则 通过AOM监控应用进程 通过AOM监控组件进程 父主题: 基础设施监控
接口调用主要是对外部服务调用当前应用程序进行监控,主要包括URL监控、dubbo服务端监控、cse服务端监控、CSEProvider集群监控、Functiongraph监控等。 相关配置请参见查看组件接口调用监控项。 基础监控 基础监控主要针对应用的JVM信息、JVM监控、GC监控、线程、JAVA方法进行监控。 相关配置请参见查看组件基础监控项。
在左侧导航栏中选择“主机监控 > 裸金属服务器”。 云服务监控 云服务监控可收集云服务内置监控指标的数据,您可以通过监控这些指标来跟踪对应云服务状态。除了查看监控数据,您还可以在云服务监控页面创建告警规则和导出原始监控数据。 查看监控指标 在监控指标页面上,您可以查看基于近1小时、近3小时
通过拓扑图查看组件间调用关系 拓扑图展示服务之间一段时间的调用关系,可以是从调用方统计,也可以是从被调用方统计。通过拓扑图可以自动梳理组件之间的调用关系,帮助用户快速定位问题。 通过拓扑图查看组件查看间调用关系 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左
AOM会基于配置的应用发现规则采集指标数据。等待大约两分钟后,您可以做如下操作: 在“应用监控”页签,找到已被监控的应用,详情请参见:通过AOM监控应用进程。 在“组件监控”页签,找到已被监控的组件,详情请参见:通过AOM监控组件进程。 更多应用发现规则操作 应用发现规则添加完成后,您还可以执行表2中的操作。 表2 相关操作
AOM仪表盘监控概述 仪表盘是AOM针对指标或日志数据提供的实时数据分析大盘。您可以创建针对指标或日志的仪表盘,其将监控数据以图表形式在监控面板中直观呈现,助力监控与分析指标或日志数据。 功能介绍 表1 功能介绍 功能名称 说明 创建AOM仪表盘 通过仪表盘可将不同图表展示到同一
ometheus监控数据等),呈现在业务指标监控大屏页面上,详情请参见监控AOM系统指标数据。 根据自身实际业务的需求,您还可以自定义大屏页面呈现的内容,详情请参见自定义业务指标监控大屏。 父主题: 仪表盘监控
查询监控数据(即将下线) 功能介绍 该接口用于查询指定时间范围内指标的监控数据,可以通过参数指定需要查询的数据维度,数据周期等。 URI POST /v1/{project_id}/ams/metricdata?fillValue=xx 替换接口请参考查询监控数据。 参数说明请参见表1。
委托管理员和普通用户。普通用户无权限在AOM监控多账号指标。 需要监控某个成员账号的指标,则单击“成员账号”文本框,在弹出的搜索框中输入账号关键字,下面的账号树中自动显示相关的成员账号,根据需要勾选需要监控的成员账号即可。 需要停止监控某个成员账号的指标,则在“账号接入”界面的“成员账号”文本框中删除对应的成员账号。
AOM告警监控概述 AOM提供告警监控能力。告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,需要您采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。事件是指AOM自身或外部服务发生了某种变化,但不一定会引起业务异常情况下上报的信息,您可根据需要对事件进行处理。
“告警列表”页面提供告警和事件的查询和处理功能,便于您更快地发现、定位并恢复故障。 功能介绍 在告警列表中,有以下关键功能: 告警列表:支持按告警级别图形化查看告警信息。 高级过滤:支持在搜索框中按告警级别 、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。 告警清除:支持单个、批量清除告警。 告警详
根据需要,单击对应仪表盘模板名称,即可监控当前Prometheus实例的指标数据。 例如,需要监控主机的磁盘分区信息,则单击“disk-partition-template”,并在仪表盘监控页面选择需要监控的主机的IP和磁盘分区信息。还可对仪表盘执行表1中的操作。 监控云服务类型Prometheus实例的指标
满足以下“任意”指标判断条件时,触发告警。 指标 需要监控的指标。通过“全量指标”方式选择指标时,仅支持英文展示和英文搜索。 单击“指标”文本框,通过下列框右侧的资源树,可以按资源类型快速选择需监控的指标。 条件 指标监控的维度。在华东-上海一区域创建应用性能监控告警规则时,需要为选择的指标设置“_
参考文档链接 一键告警 一键告警为您提供针对服务下所有资源快速开启告警的能力,旨在帮助用户快速建立监控告警体系,在资源异常时可以及时获得通知。本章节介绍如何使用一键告警功能一键开启关键监控项告警的服务。 登录AOM 2.0控制台。 在左侧导航栏中选择“告警中心 > 一键告警”。 登录CES控制台。