MAPREDUCE服务 MRS-Flume日志采集概述:Flume模块介绍
Flume模块介绍
Flume客户端/服务端由一个或多个Agent组成,而每个Agent是由Source、Channel、Sink三个模块组成,数据先进入Source然后传递到Channel,最后由Sink发送到下一个Agent或目的地(客户端外部)。各模块说明见表1。
名称 |
说明 |
---|---|
Source |
Source负责接收数据或产生数据,并将数据批量放到一个或多个Channel。Source有两种类型:数据驱动和轮询。 典型的Source样例如下:
Source必须至少和一个Channel关联。 |
Channel |
Channel位于Source和Sink之间,用于缓存Source传递的数据,当Sink成功将数据发送到下一跳的Channel或最终数据处理端,缓存数据将自动从Channel移除。 不同类型的Channel提供的持久化水平也是不一样的:
Channel支持事务特性,可保证简易的顺序操作,同时可以配合任意数量的Source和Sink共同工作。 |
Sink |
Sink负责将数据传输到下一跳或最终目的,成功完成后将数据从Channel移除。 典型的Sink样例如下:
Sink必须关联到一个Channel。 |
每个Flume的Agent可以配置多个Source、Channel、Sink模块,即一个Source将数据发送给多个Channel,再由多个Sink发送到下一个Agent或目的地。
Flume支持多个Flume配置级联,即上一个Agent的Sink将数据再发送给另一个Agent的Source。
- MapReduce服务_什么是Flume_如何使用Flume
- 如何进行日志采集和转储_日志平台_日志接入_日志转储
- 云日志采集的方法_日志分析_云日志服务-华为云
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- MapReduce服务_什么是ZooKeeper_如何使用ZooKeeper
- MapReduce服务_什么是ClickHouse_如何使用ClickHouse
- 什么是Spark_如何使用Spark_Spark的功能是什么
- MapReduce服务_什么是Hue_如何使用Hue
- MapReduce工作原理_MapReduce是什么意思_MapReduce流程_MRS_华为云
- 什么是Manager_Manager的功能_MRS运维管理