MAPREDUCE服务 MRS-通过Flume采集指定目录日志系统文件至HDFS:方案架构
方案架构
Flume-NG由多个Agent来组成,而每个Agent由Source、Channel、Sink三个模块组成,其中Source负责接收数据,Channel负责数据的传输,Sink则负责数据向下一端的发送。
名称 |
说明 |
---|---|
Source |
Source负责接收数据或通过特殊机制产生数据,并将数据批量放到一个或多个Channel。Source的类型有数据驱动和轮询两种。 典型的Source类型如下:
Source必须至少和一个Channel关联。 |
Channel |
Channel位于Source和Sink之间,用于缓存来自Source的数据,当Sink成功将数据发送到下一跳的Channel或最终目的地时,数据从Channel移除。 Channel提供的持久化水平与Channel的类型相关,有以下三类:
Channel支持事务,可提供较弱的顺序保证,可以和任何数量的Source和Sink工作。 |
Sink |
Sink负责将数据传输到下一跳或最终目的,成功完成后将数据从Channel移除。 典型的Sink类型如下:
Sink必须作用于一个确切的Channel。 |
Flume也可以配置成多个Source、Channel、Sink,如图2所示:
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- MapReduce服务_什么是Flume_如何使用Flume
- MRS备份恢复_MapReduce备份_数据备份
- MapReduce服务_什么是Hue_如何使用Hue
- MapReduce服务_什么是ZooKeeper_如何使用ZooKeeper
- 大数据分析是什么_使用MapReduce_创建MRS服务
- MapReduce服务_什么是存算分离_如何配置MRS集群存算分离
- MapReduce服务_什么是HDFS_HDFS特性
- MapReduce工作原理_MapReduce是什么意思_MapReduce流程_MRS_华为云
- MapReduce服务_什么是MapReduce服务_什么是HBase