AOM 是一个以资源数据为中心并关联日志、指标、资源、告警和事件等数据的立体 运维服务 。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。
架构图
采用三层架构
数据采集接入层
ICAgent采集数据
给主机安装ICAgent(插件式的数据采集器)并通过ICAgent上报相关的运维数据。
API接入数据
通过AOM提供的OpenAPI接口或者Exporter接口,将业务指标作为自定义指标,接入到AOM。
传输存储层
数据传输:AOM Access是用来接收运维数据的代理服务,运维数据接收上来之后,会将数据投放到Kafka队列中,利用Kafka高吞吐的能力,实时将数据传输给业务计算层。
数据存储:运维数据经过AOM后端服务的处理,将数据写入到 数据库 中,其中Cassandra用来存储时序的指标数据,Redis用来查询缓存,ETCD用来存储AOM的配置数据,ElasticSearch用来存储资源、日志、告警和事件。
业务计算层
AOM提供告警、日志、监控、指标等基础运维服务,同时也提供异常检测与分析等AI服务。