MAPREDUCE服务 MRS-HBase数据:Replication
Replication
Replication备份是在HBase上建立主备集群的容灾关系,当数据写入主集群,主集群通过WAL来主动push数据到备集群上,从而达到主备集群的实时同步。详情请参考http://hbase.apache.org/2.2/book.html#_cluster_replication。
- 该方式数据备份的优点:
- 使用replication有别于其他几种数据备份导入方式,当配置了集群间的主备关系后,数据可以实时同步(无需人为操作)。
- 相对而言,“备份”的动作占用集群的资源较少,对集群的性能影响小。
- 数据同步可靠性较高,如果备集群停止一段时间后再恢复,这中间主机群的数据依然会同步到备集群。
- 该方式数据备份的缺点和限制:
- 如果客户端写入的数据设置不写WAL,则数据无法备份到备集群。
- 由于占用的资源少,后台是通过异步的方式同步数据,实际数据没有实时同步。
- 对于开启表replication同步之前,主集群就已经存在的数据无法同步,需要借助其他方式导入的备集群。
- bulkload方式写入到主集群的数据无法同步( MRS 上的HBase对replication做了增强,支持bulkload on replication)。
具体的使用和配置方法请参考配置HBase备份和使用ReplicationSyncUp工具来进行备份数据。
- MapReduce服务_什么是MapReduce服务_什么是HBase
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- MapReduce服务_什么是HetuEngine_如何使用HetuEngine
- MapReduce服务_什么是Hue_如何使用Hue
- MapReduce服务_什么是Kafka_如何使用Kafka
- MapReduce服务_什么是HDFS_HDFS特性
- MapReduce服务_什么是Hive_如何使用Hive
- MapReduce服务_什么是Yarn_如何使用Yarn
- MapReduce服务_什么是Flink_如何使用Flink
- MapReduce服务_什么是ZooKeeper_如何使用ZooKeeper