MAPREDUCE服务 MRS-ALM-12033 慢盘故障(2.x及以前版本):告警解释

时间:2025-02-18 11:25:32

告警解释

MRS 2.x及以前版本:

  • 对于HDD盘,满足以下任意条件时触发告警:
    • 系统每3秒执行一次iostat命令,在30秒内连续10周期svctm值超过1000ms。
    • 系统每3秒执行一次iostat命令,在300秒内有超过60%的IO超过150ms。
  • 对于SSD盘,满足以下任意条件时触发告警:
    • 系统每3秒执行一次iostat命令,在30秒内连续10周期svctm值超过1000ms。
    • 系统每3秒执行一次iostat命令,在300秒内有超过60%的IO超过20ms。

当系统连续15分钟不满足以上所有条件时,告警自动清除。

MRS 1.9.3.10及之后的补丁的版本:

  • 对于HDD盘,满足以下任意条件时触发告警:
    • 系统默认每3秒采集一次数据,在30秒内至少7个采集周期的svctm时延达到1000ms。
    • 系统默认每3秒采集一次数据,在300秒内至少50%次采集到的svctm时延达到150ms。
  • 对于SSD盘,满足以下任意条件时触发告警:
    • 系统默认每3秒采集一次数据,在30秒内至少7个周期的svctm时延达到1000ms。
    • 系统默认每3秒采集一次数据,在300秒内至少50%次检测到的svctm时延达到20ms。

系统采集周期为3秒,检测周期为30秒或300秒,当系统连续3个30秒、300秒的周期均不满足以上条件时,告警自动清除。

相关参数获取方法请参考参考信息

support.huaweicloud.com/usermanual-mrs/alm_12033.html