检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
组件列表总览 组件列表展示各个组件的指标监控项,包括:组件、环境、应用、url调用次数等信息。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”,即可在组件列表中快速筛选出需要的组件。
概述 传统ITIL流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。应用资源管理将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设。 注意事项 如需
概述 AOM提供告警规则设置功能。通过告警规则可对服务设置事件条件,对资源的指标设置阈值条件,或对资源的日志设置搜索分析、关键词统计以及SQL查询等条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件
调用链 在企业微服务之间调用复杂的场景下,Agent会抽样一些请求,拦截对应请求及后续一系列的调用信息。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 调用链”,进入调用链页面。 图1 查看调用链 在查询条件下输入查询条件查询具体的调用链列表,详细请参见表1,也可在界面下方新增自定义查询条件。
接入中心总览 通过新版接入中心可以快速接入AOM指标、LTS日志和APM调用链,接入完成后,即可方便地在“指标浏览”等页面查看相关资源或应用的运行状态、各个指标的使用情况、接入的LTS日志、APM调用链等信息。 接入中心(新版)功能在邀测中,支持华北-北京四、华东-上海一局点,仅
告警规则 概述 创建指标告警规则 创建事件告警规则 创建应用性能监控告警规则 创建日志告警规则 管理告警规则 父主题: 告警管理
入门实践 当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
组件列表 组件列表总览 拓扑 Profiler性能分析 Debugging诊断 接口调用 基础监控 异常 外部调用 通信协议 数据库 Web容器 消息队列 远程过程调用 日志 基础设施 调用链 组件设置 父主题: 应用监控
集群指标及其维度 集群指标由AOM通过主机指标汇聚,汇聚的集群指标不包含master节点的主机指标。 表1 集群指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_cluster_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core)
安装UniAgent 对主机安装UniAgent,UniAgent有三种安装方式:Excel导入安装、手动安装和远程安装。 您可以按照您的实际场景进行选择。 表1 安装方式 方式 适用场景 手动安装 首次安装UniAgent时,必须使用手动安装方式。 远程安装 必须有可用的安装机,才可进行远程安装。
修订记录 表1 版本说明列表 发行时间 更新说明 2022-04-16 告警降噪功能优化。 2022-01-25 支持创建告警规则。通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告
基础指标:IEF指标 介绍IEF服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。 IEF服务的指标上报到AOM后,系统会根据指标映射规则将IEF指标转换后,呈现在AOM控制台的“指标浏览”界面。 表1 IEF服务监控指标 指标类别 分类 AOM呈现的指标 IEF上报的指标
基础指标:虚机指标 介绍通过ICAgent上报到AOM的虚机指标的类别、名称、含义等信息。 表1 虚机指标说明 指标类别 指标 指标名称 指标含义 取值范围 单位 网络指标 aom_node_network_receive_bytes 下行Bps 该指标用于统计测试对象的入方向网络流速。
添加环境 组件创建完成后,可根据主机、区域等信息为组件添加不同的环境,方便统一管理各资源或应用。 添加环境 登录AOM 2.0控制台。 在左侧导航栏选择“应用洞察(日落) > 应用资源管理”,进入“应用资源管理”界面。 选择企业项目并在左侧导航栏中选择“应用管理”。 在左侧树节点,将光标移至待操作的组件名称后,单击。
采集管理 表1 采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。
产品优势 兼容开放 支持各类开源协议低门槛接入,开放了运营、运维数据查询接口和采集标准,提供全托管、免运维、低成本的云原生监控能力。 开箱即用 无需修改业务代码即可接入使用, 非侵入式数据采集,安全无忧。 丰富的数据源 融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源。
容器组件指标及其维度 表1 容器指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_container_cpu_limit_core) 该指标用于统计测量对象限制的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_container_cpu_used_core)
使用流程 应用运维管理(Application Operations Management,以下简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。
功能特性 Prometheus监控具有监控数据采集、存储、计算、展示、告警等能力。监控指标覆盖广,涵盖容器、云服务、中间件、数据库、应用以及业务等多种监控数据。本文介绍Prometheus 监控支持的主要功能。 表1 监控对象接入 功能 功能说明 创建Prometheus实例 支
概述 应用运维管理(Application Operations Management)是云上应用的一站式立体化运维管理平台,实时监控用户的应用及相关云资源,采集并关联资源的各项指标、日志及事件等数据共同分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助用户及时发现故障