检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
采集管理 统一管理插件,并为AOM提供指令下发功能,如脚本下发和执行。 开放 支持原生PromQL数据上报,也可通过API等方式上报数据,并也可通过grafana查看数据,通过kafka转储数据。
对CCE集群下的采集器统一管理,对主机组、代理区域进行管理,以及查看UniAgent以及插件的操作日志等。
BMS不支持基础监控,需要安装主机监控Agent插件。 操作系统监控 通过在ECS或BMS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。数据采集频率为1分钟1次。除了CPU使用率等指标外,还可以支持内存使用率(Linux)等指标,详见云产品监控指标。
ICAgent和UniAgent是同一个插件吗?
操作流程 ECS主机手动安装UniAgent:手动为ECS主机安装Uniagent,统一管理指标采集插件。 AOM接入弹性云服务器 ECS:通过Node Exporter插件将ECS指标上报到AOM,并储存在ECS类型的Prometheus实例中。
配置弹性云服务器 ECS接入AOM Node Exporter是Prometheus的开源指标数据收集插件,负责从目标Jobs收集数据,并把收集到的数据转换为Prometheus支持的时序数据格式。
在左侧导航栏中,选择“UniAgent安装与配置”,选择待安装ICAgent的主机,单击“插件批量操作”。 在弹出的对话框中,操作类型选择“安装”,选择插件为“ICAgent”,插件版本选择“5.12.163”,在“ak”、“sk”中输入1获取的AK/SK。
通过为中间件创建采集任务,并执行插件脚本,就可以对中间件上报到AOM的指标进行监控,结合AOM应用运维管理平台和开源Grafana可以提供一站式全方位的监控体系,帮助业务快速发现和定位问题,减轻故障给业务带来的影响。
中间件监控,无需额外安装其他插件,即可在AOM界面监控关系型数据库、分布式缓存服务等中间件的运行状态及各种指标。 2018-8-15 支持创建通知规则,将告警信息以短信或邮件的方式发送给指定人员。 2018-8-5 中国华北区支持使用模板创建批量静态和智能阈值规则。
支持 支持 Prometheus监控 全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘,可灵活扩展云原生组件指标插件。
第三方云厂商或互联网数据中心自建Prometheus对接到AOM Prometheus实例 应用场景 云上用户经常会遇到多云或者跨region采集自建Prometheus指标数据场景。典型场景例如:将者第三方云厂商或互联网数据中心(Internet Data Center,以下简称
具体操作请参见:通过Java SDK(log4j2插件)上报日志 (LTS)。 LOGBack SDK 可以直接在logback中配置华为云appender,将通过logback产生的日志直接上报至云日志服务。具体操作请参见:通过LogBack SDK上报日志 (LTS)。
通过ICAgent插件采集指标数据时,采集周期为1分钟,不支持修改。 关联指标项存储时长 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。 指标维度个数 每个指标的维度最多为20个。 通过指标查询接口查询指标数量 单次最大可同时查询20个指标。
容器监控:在云容器引擎 CCE购买集群和节点后,自动安装ICAgent插件,将CCE集群指标上报到AOM,用户无需手动接入。 配置告警行动规则:通过创建告警行动规则关联SMN主题与消息模板,当CCE的指标数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。
操作流程 ECS主机安装 UniAgent:为AOM服务控制台所在Region区主机安装UniAgent,统一管理指标采集插件。 创建主机组:主机进行虚拟分组,便于分类管理、提升配置多个主机数据采集的效率。
建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 实践场景 用户体验至上的互联网时代,页面的响应速度、访问时延和页面的访问成功率常常会影响用户的体验,如果无法及时获知,就会导致流失大量用户,某商城的运维人员使用开源的监控软件
表2 添加图表 数据来源 添加方式 使用场景 指标数据 请参见添加指标图表 监控业务层、应用层、Prometheus 中间件、Prometheus 运行环境、Prometheus 云服务、开源监控系统、Prometheus API/SDK接入和Prometheus 自定义插件接入的指标
AOM最佳实践汇总 本文汇总了应用运维管理(AOM,Application Operations Management)常见应用场景的操作实践,为每个实践提供详细的方案描述和操作指导,帮助用户轻松使用AOM。 表1 AOM 最佳实践一览表 最佳实践 说明 通过AOM告警分组规则清除