MAPREDUCE服务 MRS-MRS可靠性增强:节点可靠性

时间:2024-04-01 09:39:25

节点可靠性

  • 操作系统健康状态监控

    周期采集操作系统硬件资源使用率数据,包括CPU、内存、硬盘、网络等资源的使用率状态。

  • 进程健康状态监控

    MRS 提供业务实例的状态以及业务实例进程的健康指标的检查,能够让用户第一时间感知进程健康状态。

  • 硬盘故障的自动处理

    MRS对开源版本进行了增强,可以监控各节点上的硬盘以及文件系统状态。如果出现异常,立即将相关分区移出存储池;如果硬盘恢复正常(通常是因为用户更换了新硬盘),也会将新硬盘重新加入业务运作。这样极大简化了维护人员的工作,更换故障硬盘可以在线完成;同时用户可以设置热备盘,从而极大缩减了故障硬盘的修复时间,有利于提高系统的可靠性。

  • 节点磁盘LVM配置

    MRS支持将多个磁盘配置成LVM(Logic Volume Management),多个磁盘规划成一个逻辑卷组。配置成LVM可以避免各磁盘间使用不均的问题,保持各个磁盘间均匀使用在HDFS和Kafka等能够利用多磁盘能力的组件上尤其重要。并且LVM可以支持磁盘扩容时不需要重新挂载,避免了业务中断。

support.huaweicloud.com/productdesc-mrs/mrs_08_0045.html