检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
关联资源 为组件创建对应环境后,即可为环境关联相关资源实例,后续可通过应用监控功能实时监控资源的使用情况。 查看资源列表 登录AOM 2.0控制台。 在左侧导航栏选择“应用洞察(日落) > 应用资源管理”,进入“应用资源管理”界面。 选择企业项目并在左侧导航栏中选择“应用管理”。
智能洞察概述 AOM智能洞察引擎持续监控您的应用和资源,通过历史数据和问题特征发现问题,并针对每个问题会给出相应的根因分析和建议。 该功能当前仅在华北-乌兰察布二零一、华南-广州、华北-北京四区域开放。 功能介绍 事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top
虚机组件指标及其维度 AOM中,虚机组件指的是进程,虚机组件指标指的就是进程指标。 表1 进程指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_process_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU
单击“新增指标”可多次添加监控指标,并为指标设置统计周期等信息。将光标移动到指标数据和对应监控条件后,还可以根据需要执行以下操作: 单击监控条件后的,可将对应行的指标数据在当前图表中隐藏。 单击监控条件后的,可将对应行的指标数据和监控条件转换为Prometheus命令。 单击监控条件后的,可快
当在使用AOM的全屏模式(包括运维概览全屏模式和仪表盘全屏模式)进行监控时,全屏模式会随着用户账号的退出而退出,无法实时进行监控。为满足您的多样化需求,AOM支持您自定义全屏模式在线时长。 注意事项 为提高安全性,请在不需要使用全屏模式进行监控时,及时退出全屏模式。 全屏模式在线时长与是否操作无
实例指标及其维度 实例指标是由容器或进程指标汇聚而来的,其指标维度与容器或进程指标维度相同。 容器指标详见:容器组件指标及其维度 进程指标详见:虚机组件指标及其维度。 父主题: 指标总览
将运行在主机上的应用接入AOM,以便能在AOM界面监控。满足内置应用发现规则的应用,安装ICAgent后该应用会自动被发现;对于不满足内置应用发现规则的应用,您则需配置应用发现规则。 配置日志采集路径(可选) 如果您需使用AOM监控主机的日志,则需配置日志采集路径。 运维(可选)
告警条件 事件类告警的触发条件。包含以下信息: 事件名称:根据“监控对象”设置的事件名称显示。如果在“监控对象”中未选择具体的事件名称,则此处显示为全部事件且不可选。 触发方式:事件类告警的触发方式。 累计触发:某个监控周期内达到累计次数则触发告警,按照设置的频率发送对应的事件告警通知。
主机ICAgent功能异常,请联系技术人员处理。 可能原因二:AOM不支持监控当前资源类型 修复建议:请检查您的资源是否为AOM监控的类型,AOM当前支持监控的资源类型有:主机、K8s容器、用户进程(AOM不监控主机的系统进程)。 可能原因三:资源被删除或被停止 修复建议: 在ECS界面检查主机是否已被重启、关机或删除。
故障,避免造成业务损失。 监控 提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能。 应用监控 应用是您根据业务需要,对相同或者相近业务的一组组件进行逻辑划分,AOM提供以应用维度整体进行监控。 组件监控 组件即您部署的服务,包括容器和普通进程。 组件列表展示了每个组件的
该指标用于统计主机本地时间与NTP服务器时间是否同步。 0、1 0表示同步 1表示未同步 无 进程数量(aom_node_process_number) 该指标用于统计测量对象上的进程数量。 ≥0 无 显卡温度(aom_node_gpu_temperature_centigrade)
系统预置的云服务类型的dms-rabbitmq仪表盘,在RabbitMQ AMQP-0-9-1版本暂不支持监控部分指标,RabbitMQ支持的监控指标请见RabbitMQ支持的监控指标。 1个区域中最多可创建1000个仪表盘分组。 1个区域中最多可创建1000个仪表盘。 1个仪表盘中最多可添加50个图表。
业务监控(BETA) 主要提供创建日志指标规则功能。 基础设施监控 主要提供工作负载监控、集群监控、主机监控、进程监控和云服务监控的功能。 工作负载监控 工作负载监控的对象通过CCE部署的工作负载,通过工作负载监控可及时了解工作负载的资源使用、状态和告警等信息。 集群监控 集群
创建日志指标规则 基础设施监控 AOM提供基础设施监控功能,可以对工作负载、集群、主机、进程与云服务进行监控。通过工作负载监控您可以及时了解工作负载的资源使用、状态和告警等信息;提供集群监控可实时监控集群的多项基础监控指标和相关的告警、事件数据;通过主机监控您可以及时了解主机的资源
云服务授权 为当前用户一键授予云资源实例 (RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM 2.0服务生效。 前提条件
停止采集应用指标”告警 。 由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。
如何启用NGINX stub_status模块? Nginx Prometheus Exporter是通过Nginx的stub_status模块对其进行监控,需要确保Nginx服务启用了 stub_status模块。具体步骤如下: 登录到业务Nginx服务所在节点,执行以下命令检查Nginx是
停止采集应用指标”告警 。 由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。
ster_name、node、pod、container时,可以跳转至AOM的系统内置仪表盘中查询相应时间的指标曲线。 规则类型为应用性能监控的告警规则触发的告警:单击告警详情页的应用、组件、环境,可跳转至组件指标项详情页。 查看已清除告警 在右上角单击“活动告警”,在下拉列表中选择“历史告警”,可查看被清除的告警。
选。 图2 定义阈值 单击“添加”,完成创建多个单条静态阈值规则,一个资源对应一个规则,可使用独立的规则对某个资源进行监控。 对于一个单条静态阈值规则,若其监控对象为某个主机,当主机的CPU使用率超限时,在告警界面产生阈值告警,可在左侧导航栏中选择“告警 > 告警列表”,在告警列