MAPREDUCE服务 MRS-创建大量znode后ZooKeeper Server启动失败:回答

时间:2024-07-02 16:39:30

回答

创建大量节点后,follower与leader同步时数据量大,在集群数据同步限定时间内不能完成同步过程,导致超时,各个ZooKeeper Server启动失败。

参考修改集群服务配置参数章节,进入ZooKeeper服务“全部配置”页面。不断尝试调大ZooKeeper配置文件“zoo.cfg”中的“syncLimit”“initLimit”两参数值,直到ZooKeeperServer正常。

表1 参数说明

参数

描述

默认值

syncLimit

follower与leader进行同步的时间间隔(时长为ticket时长的倍数)。如果在该时间范围内leader没响应,连接将不能被建立。

15

initLimit

follower连接到leader并与leader同步的时间(时长为ticket时长的倍数)。

15

如果将参数“initLimit”“syncLimit”的参数值均配置为“300”之后,ZooKeeper server仍然无法恢复,则需确认没有其他应用程序正在kill ZooKeeper。例如,参数值为“300”,ticket时长为2000毫秒,即同步限定时间为300*2000ms=600s。

可能存在以下场景,在ZooKeeper中创建的数据过大,需要大量时间与leader同步,并保存到硬盘。在这个过程中,如果ZooKeeper需要运行很长时间,则需确保没有其他监控应用程序kill ZooKeeper而判断其服务停止。

support.huaweicloud.com/cmpntguide-lts-mrs/mrs_01_2108.html