MAPREDUCE服务 MRS-执行balance常见问题定位方法:问题2:执行balance失败,/system/balancer.id文件异常

时间:2024-08-27 10:23:52

问题2:执行balance失败,/system/balancer.id文件异常

问题详细

在HDFS客户端启动一个Balance进程,该进程被异常停止后,再次执行Balance操作,操作会失败。

org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.protocol.RecoveryInProgressException): Failed to APPEND_FILE /system/balancer.id for DFSClient because lease recovery is in progress. Try again later.

问题根因:

通常,HDFS执行Balance操作结束后,会自动释放“/system/balancer.id”文件,可再次正常执行Balance。

但在上述场景中,由于第一次的Balance操作是被异常停止的,所以第二次进行Balance操作时,“/system/balancer.id”文件仍然存在,则会触发append /system/balancer.id操作,进而导致Balance操作失败。

解决方法

方法1:等待硬租期超过1小时后,原有客户端释放租约,再执行第二次Balance操作。

方法2:删除HDFS中的“/system/balancer.id”文件,再执行下次Balance操作。

support.huaweicloud.com/trouble-mrs/mrs_03_0094.html