MapReduce服务 MRS-MRS可靠性增强:系统可靠性
系统可靠性
- 管理节点均实现HA
Hadoop开源版本的数据、计算节点已经是按照分布式系统进行设计的,单节点故障不影响系统整体运行;而以集中模式运作的管理节点可能出现的单点故障,就成为整个系统可靠性的短板。
MRS 对所有业务组件的管理节点都提供了类似的双机的机制,包括Manager、HDFS NameNode、HiveServer、HBase HMaster、YARN ResourceManager、KerberosServer、LdapServer等,全部采用主备或负荷分担配置,有效避免了单点故障场景对系统可靠性的影响。
- 异常场景下的可靠性保证
通过可靠性分析方法,梳理软件、硬件异常场景下的处理措施,提升系统的可靠性。
- 保障意外掉电时的数据可靠性,不论是单节点意外掉电,还是整个集群意外断电,恢复供电后系统能够正常恢复业务,除非硬盘介质损坏,否则关键数据不会丢失。
- 硬盘亚健康检测和故障处理,对业务不造成实际影响。
- 自动处理文件系统的故障,自动恢复受影响的业务。
- 自动处理进程和节点的故障,自动恢复受影响的业务。
- 自动处理网络故障,自动恢复受影响的业务。
- 数据备份与恢复
为应对数据丢失或损坏对用户业务造成不利影响,在异常情况下快速恢复系统,MRS根据用户业务的需要提供全量备份、增量备份和恢复功能。
- RabbitMQ如何保证消息的可靠性_分布式消息系统_分布式消息RabbitMQ-华为云
- MapReduce服务_什么是MapReduce服务_什么是HBase
- MRS优势_什么是MRS_MRS功能
- MapReduce服务_什么是Hive_如何使用Hive
- MapReduce服务_什么是Flume_如何使用Flume
- MapReduce服务_什么是Hue_如何使用Hue
- MapReduce服务_什么是Kafka_如何使用Kafka
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- MapReduce服务_什么是HDFS_HDFS特性
- MapReduce服务_什么是Loader_如何使用Loader