功能架构说明:
托管&运行态:AOM可无缝对接多个上层运维服务,支持快速从应用管理与运维平台(ServiceStage)、函数工作流(FunctionGraph)和微服务引擎(Cloud Service Engine,CSE)等上层运维服务采集指标数据并实时、可视化呈现。
可观测性分析:基于四层指标体系(基础设施层指标、中间件层指标、应用层指标和业务层指标),通过事务监控、容器监控、普罗监控等功能,提供异常检测、历史数据分析、性能分析、关联性和场景化分析等可观测性分析能力。
运维自动化:提供批量磁盘清理、作业编排、脚本执行等功能,将日常运维操作服务化、标准化、自动化。
应用资源管理:通过应用管理、资源搜索等功能,将所有资源对象与应用统一管理,为AOM上层运维场景服务提供准确、及时、一致的资源配置数据。
采集管理:统一管理插件,并为AOM提供指令下发功能,如脚本下发和执行。
开放:支持原生PromQL数据上报,也可通过API等方式上报数据,并也可通过grafana查看数据,通过kafka转储数据。
应用运维管理 AOM的优势
-
集中管理云监控、云日志、性能、Prometheus等多维度可观测性数据源,提供统一监控与分析。
集中管理云监控、云日志、性能、Prometheus等多维度可观测性数据源,提供统一监控与分析。
-
应用视角基于CMDB为复杂应用提供可观测性分析能力,容器视角实现Kubernetes云原生用户短、平、快容器洞察。
应用视角基于CMDB为复杂应用提供可观测性分析能力,容器视角实现Kubernetes云原生用户短、平、快容器洞察。
-
支持定时、周期和告警触发系统变更,提供批量主机下发脚本作业、批量定时开关机等运维操作。
支持定时、周期和告警触发系统变更,提供批量主机下发脚本作业、批量定时开关机等运维操作。
-
提供分组、抑制和静默等告警降噪策略,在发送告警通知前按告警降噪规则对告警进行处理,从容应对海量告警风暴。
提供分组、抑制和静默等告警降噪策略,在发送告警通知前按告警降噪规则对告警进行处理,从容应对海量告警风暴。
应用运维管理 AOM基本功能
-
作为应用运维管理 AOM的应用资源管理中心,将所有资源对象与应用统一管理,为AOM监控中心、自动化运维子服务和LTS、APM等上层运维服务提供准确、及时、一致的资源配置数据。
作为应用运维管理 AOM的应用资源管理中心,将所有资源对象与应用统一管理,为AOM监控中心、自动化运维子服务和LTS、APM等上层运维服务提供准确、及时、一致的资源配置数据。
-
作为应用运维管理 AOM的一站式监控平台,提供从资源数据发现、资源数据展示到数据异常告警的全方位、可视化监控服务,可应用于ECS、RDS、CCE等云产品的可观测性分析。
作为应用运维管理 AOM的一站式监控平台,提供从资源数据发现、资源数据展示到数据异常告警的全方位、可视化监控服务,可应用于ECS、RDS、CCE等云产品的可观测性分析。
-
作为应用运维管理 AOM的自动化运维平台,提供从运维任务创建、触发到审批的端到端自动化运维服务,可应用于ECS、RDS、CCE等云产品的运维管理。
作为应用运维管理 AOM的自动化运维平台,提供从运维任务创建、触发到审批的端到端自动化运维服务,可应用于ECS、RDS、CCE等云产品的运维管理。
-
作为应用运维管理 AOM的采集管理平台,完成统一插件生命周期管理,并为AOM提供指令下发功能,如脚本下发和执行。UniAgent自身不提供数据采集能力,运维数据由不同的插件分工采集。
作为应用运维管理 AOM的采集管理平台,完成统一插件生命周期管理,并为AOM提供指令下发功能,如脚本下发和执行。UniAgent自身不提供数据采集能力,运维数据由不同的插件分工采集。
应用运维管理 AOM应用场景
-
当应用模型层级复杂,需要通过应用快速找到依赖的云资源,以应用为基础,配置统一监控大盘、阈值告警、告警降噪策略、权限管理和变更管理等
优势:
应用模型灵活
支持应用/子应用(可选)/组件/环境,最多6级模型关系
容器挂载配置
用户只需要在工作负载中添加应用、组件和环境名称,容器可自动挂载CMDB树
基于CMDB的可观测分析
AOM支持将指标、日志和性能数据关联至CMDB应用上,用户可统一对应用与资源运维分析
应用进程发现
发现规则支持通过环境变量或进程启动命令行提取CMDB信息,采集器在采集指标、日志时同步完成CMDB树创建
当应用模型层级复杂,需要通过应用快速找到依赖的云资源,以应用为基础,配置统一监控大盘、阈值告警、告警降噪策略、权限管理和变更管理等
优势:
应用模型灵活
支持应用/子应用(可选)/组件/环境,最多6级模型关系
容器挂载配置
用户只需要在工作负载中添加应用、组件和环境名称,容器可自动挂载CMDB树
基于CMDB的可观测分析
AOM支持将指标、日志和性能数据关联至CMDB应用上,用户可统一对应用与资源运维分析
应用进程发现
发现规则支持通过环境变量或进程启动命令行提取CMDB信息,采集器在采集指标、日志时同步完成CMDB树创建
-
通过融合APM、LTS和CES,打造立体化监控平台。业务指标可通过APM事务或ELB负载均衡日志提取,应用指标通过APM应用性能或Prometheus获取,资源指标直接集成云监控。同时用户也可将不同维度指标关联到CMDB树上,按应用模型统一管理
优势
全方位监控
覆盖基础设施、云数据库、云中间件、应用等多个维度监控。提供一站式运维能力
故障关联分析
通过应用、组件、环境等多维度关联和分析上百种运维指标和告警数据,以便您迅速定位故障原因
数据开放
兼容PromQL查询语法,支持开源Grafana对接指标
通过融合APM、LTS和CES,打造立体化监控平台。业务指标可通过APM事务或ELB负载均衡日志提取,应用指标通过APM应用性能或Prometheus获取,资源指标直接集成云监控。同时用户也可将不同维度指标关联到CMDB树上,按应用模型统一管理
优势
全方位监控
覆盖基础设施、云数据库、云中间件、应用等多个维度监控。提供一站式运维能力
故障关联分析
通过应用、组件、环境等多维度关联和分析上百种运维指标和告警数据,以便您迅速定位故障原因
数据开放
兼容PromQL查询语法,支持开源Grafana对接指标
应用运维管理 AOM常见问题解答
应用运维管理 AOM常见问题解答
应用运维管理 AOM帮你您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行
应用运维管理 AOM帮你您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行