检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置预聚合规则提升指标查询效率 预聚合(Recording Rule)可以对落地的指标数据做二次开发。您可以配置预聚合规则将计算过程提前写入端,减少查询端资源占用。 应用场景 某些指标查询可能需要在查询端进行大量的计算,查询端压力过大,影响查询性能。通过配置预聚合规则对一些常用的
AOM告警规则概述 AOM提供告警规则和事件规则设置功能。通过创建指标、日志和应用性能监控告警规则,实时监控环境中主机、组件等资源使用情况,便于您更快地发现、定位并恢复故障。通过创建事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 功能说明 指标告警规则
应用场景 AOM应用广泛,下面介绍AOM的两个典型应用场景,以便您深入了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监
简介 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地汇聚到相同的统计信息中。 系统指标的命名空间:命名空间是固定不变的,均以“PAAS
基本概念 指标 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计信息中。维度是指标的分类,每个指标都
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
出全屏”,或者按键盘中的“Esc”可退出全屏模式。 轮播仪表盘 选择待操作的仪表盘,在“仪表盘”页面右上角单击。具体操作请参见设置全屏模式在线时长。 仪表盘设置 选择待操作的仪表盘,在“仪表盘”页面右上角单击。具体操作请参见新增变量。 查询时间设置 选择待操作的仪表盘,在“仪表盘
应用场景 提升用户体验 业务痛点 行业竞争激烈,用户对服务的体验要求高,尤其是用户体验成为互联网企业的核心竞争力。如何能获取用户的真实体验感受,减少流失率,提升用户转化率成为企业的难题。 解决方案 AOM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到服务器
网络指标及其维度 表1 网络指标 指标名称 指标含义 取值范围 单位 下行Bps(aom_node_network_receive_bytes) 该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Byte/s) 下行Pps(aom_node_network_receive_packets)
应用监控 应用监控概述 查看应用性能指标 监控组件性能指标 通过全局拓扑图查看应用间调用关系 通过调用链查看微服务间调用关系 管理APM探针启停状态 APM配置
应用资源管理 表1 应用资源管理基本概念 术语 说明 应用资源管理 简称CMDB,在AOM2.0中管理应用与云资源的关系,并为AOM的监控、自动化运维、APM服务提供统一、及时的资源环境管理服务。 应用TOPO结构 资源与应用关系的层次结构。CMDB遵循“应用 + 子应用(可选)+
规则。具体操作请参见创建指标告警规则。 轮播仪表盘 在仪表盘列表单击待操作的仪表盘名称,在仪表盘页面右上角单击。具体操作请参见设置全屏模式在线时长。 仪表盘设置 在仪表盘列表单击待操作的仪表盘名称,在仪表盘页面右上角单击。具体操作请参见设置AOM仪表盘过滤器。 查询时间设置 在仪
安装UniAgent 统一数据采集Agent(简称UniAgent)完成统一插件生命周期管理,并为AOM提供指令下发功能,如脚本下发和执行。UniAgent本身不提供数据采集能力,运维数据由不同的插件分工采集,可在接入中心安装对应的插件,并创建采集任务,来进行指标数据采集。 AO
通过调用链查看微服务间调用关系 在企业微服务之间调用复杂的场景下,Agent会抽样一些请求,拦截对应请求及后续一系列的调用信息。您可以通过调用链查看微服务间调用关系。 通过调用链查看微服务间调用关系 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 调用链”,进入调用链页面。
应用资源管理概述 传统ITIL流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。应用资源管理将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设。 约束与限制
安装UniAgent 统一数据采集Agent(简称UniAgent)完成统一插件生命周期管理,并为AOM提供指令下发功能,如脚本下发和执行。UniAgent本身不提供数据采集能力,运维数据由不同的插件分工采集,可在接入中心安装对应的插件,并创建采集任务,来进行指标数据采集。 AO
中间件接入AOM总览 AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持MySQL、Redis、Kafka等自建中间件指标接入AOM,并查看自建中间件日志接入LTS相关操作文档。 配置中间件接入AOM 登录AOM 2.0控制台。 在左侧导航栏中选择“接入 > 接入中心”,进入新版接入中心页面。
配置AOM告警规则 AOM告警规则概述 创建AOM指标告警规则 创建AOM事件告警规则 创建AOM应用性能监控告警规则 创建AOM日志告警规则 批量创建AOM云服务告警规则 管理AOM告警规则 标签和标注 普罗语句说明 父主题: 告警监控
集群指标及其维度 集群指标由AOM通过主机指标汇聚,汇聚的集群指标不包含master节点的主机指标。 表1 集群指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_cluster_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core)
修订记录 表1 版本说明列表 发行时间 更新说明 2022-04-16 告警降噪功能优化。 2022-01-25 支持创建告警规则。通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告