-
ALM-14026 DataNode块数超过阈值 - MapReduce服务 MRS
ALM-14026 DataNode块数超过阈值 告警解释 系统每30秒周期性检测每个DataNode上的块数,当检测到当前的DataNode节点上块数超过阈值时产生该告警。
-
ALM-29005 Impalad JDBC连接数超过阈值 - MapReduce服务 MRS
ALM-29005 Impalad JDBC连接数超过阈值 告警解释 以30s为周期检测连接到该Impalad节点的客户端连接数,当检测到的连接数超过自定义阈值(默认60)时,系统产生此告警。 当系统检测到客户端连接数减少到阈值以下时,告警将自动解除。
-
ALM-29006 Impalad ODBC连接数超过阈值 - MapReduce服务 MRS
ALM-29006 Impalad ODBC连接数超过阈值 告警解释 以30s为周期检测连接到该Impalad节点的客户端连接数,当检测到的连接数超过自定义阈值(默认60)时,系统产生此告警。 当系统检测到客户端连接数减少到阈值以下时,告警将自动解除。
-
ALM-14028 待补齐的块数超过阈值 - MapReduce服务 MRS
ALM-14028 待补齐的块数超过阈值 告警解释 系统每30秒周期性检测待补齐的块数量,并把待补齐的块数量和阈值相比较。需补齐的块数量指标默认提供一个阈值范围。当检测到丢失的块数量超出阈值范围时产生该告警。
-
ALM-14029 单副本的块数超过阈值 - MapReduce服务 MRS
ALM-14029 单副本的块数超过阈值 告警解释 系统每4个小时周期性检测单副本块的数量,并把当前单副本的块数和阈值相比较。单副本的块数量指标默认提供一个阈值范围。当检测到单副本的块数量超出阈值范围时产生该告警。 待补齐的块数量小于阈值时,告警恢复。
-
ALM-12040 系统熵值不足(2.x及以前版本) - MapReduce服务 MRS
当检查到真随机数方式已经配置或者伪随机数方式中配置了随机数参数或者没有配置但是五次检查中,至少有一次熵值大于等于500,则发送恢复告警。 告警属性 告警ID 告警级别 可自动清除 12040 严重 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。
-
ALM-29008 Impalad ODBC连接数超过阈值 - MapReduce服务 MRS
ALM-29008 Impalad ODBC连接数超过阈值 告警解释 以30s为周期检测连接到该Impalad节点的客户端连接数,当检测到的连接数超过自定义阈值(默认60)时,系统产生此告警。 当系统检测到客户端连接数减少到阈值以下时,告警将自动解除。
-
ALM-16000 连接到HiveServer的session数占最大允许数的百分比超过阈值(2.x及以前版本) - MapReduce服务 MRS
ALM-16000 连接到HiveServer的session数占最大允许数的百分比超过阈值(2.x及以前版本) 告警解释 系统每30秒周期性检测连接到HiveServer的Session数占HiveServer允许的最大session数的百分比,该指标可在Hive服务监控界面查看
-
配置健康检查报告保存数 - MapReduce服务 MRS
配置健康检查报告保存数 操作场景 在不同时间、不同使用场景下,MRS集群、服务和主机产生的健康检查报告结果不完全相同。如果需要保存更多的报告用于比较时,可以在MRS Manager修改健康检查报告保存的文件数。 健康检查报告保存的文件数不区分集群、服务或主机类型的健康检查报告。
-
ALM-12190 Knox连接数超过阈值 - MapReduce服务 MRS
ALM-12190 Knox连接数超过阈值 告警解释 系统周期性检测Knox所有拓扑的连接数情况,当存在拓扑的当前连接数超过最大连接数的阈值(默认为90%)时上报此告警,当连接数低于阈值后,告警自动清除。 该告警适用于MRS 3.1.0及之后版本集群。
-
ALM-45179 OBS readFully接口调用失败数高于阈值 - MapReduce服务 MRS
ALM-45179 OBS readFully接口调用失败数高于阈值 告警解释 系统每30秒周期性检测OBS readFully接口调用失败数是否高于阈值,当检测到大于所设置阈值时就会产生该告警 。 当OBS readFully接口调用失败数小于阈值时,该告警会自动清除。
-
ALM-45180 OBS read接口调用失败数高于阈值 - MapReduce服务 MRS
ALM-45180 OBS read接口调用失败数高于阈值 告警解释 系统每30秒周期性检测OBS read接口调用失败数是否高于阈值,当检测到大于所设置阈值时就会产生该告警 。 当OBS read接口调用失败数小于阈值时,该告警会自动清除。
-
ALM-45326 Presto Coordinator线程数超过阈值 - MapReduce服务 MRS
调整线程数告警触发阈值。
-
ALM-18025 Yarn被终止的任务数超过阈值 - MapReduce服务 MRS
查看“Yarn被终止的任务数超过阈值”告警详情中的“附加信息”,确认监控阈值是否设置过小。 是,执行3。 否,执行4。 选择“运维 > 告警 > 阈值设置 > 待操作集群的名称 > Yarn > 其它 > root队列下被杀死的任务数”,修改该监控的阈值。执行6。
-
ALM-45181 OBS write接口调用失败数高于阈值 - MapReduce服务 MRS
ALM-45181 OBS write接口调用失败数高于阈值 告警解释 系统每30秒周期性检测OBS write接口调用失败数是否高于阈值,当检测到大于所设置阈值时就会产生该告警 。 当OBS write接口调用失败数小于阈值时,该告警会自动清除。
-
ALM-13001 ZooKeeper可用连接数不足 - MapReduce服务 MRS
ALM-13001 ZooKeeper可用连接数不足 告警解释 系统每60秒周期性检测ZooKeeper服务连接数状态,当检测到ZooKeeper实例连接数超出阈值(最大连接数的80%)时产生该告警。
-
ALM-12186 用户CGroup任务数使用率超过阈值 - MapReduce服务 MRS
CGroup任务使用率 = CGroup任务使用数 / 最大CGroup任务数。
-
ALM-13007 ZooKeeper客户端可用连接数不足 - MapReduce服务 MRS
ALM-13007 ZooKeeper客户端可用连接数不足 告警解释 系统每60秒周期性检测ZooKeeper客户端连接到ZooKeeper服务器上的活动进程数,当检测到连接数目超过阈值时产生该告警。
-
ALM-25007 SlapdServer连接数超过阈值 - MapReduce服务 MRS
ALM-25007 SlapdServer连接数超过阈值 告警解释 系统每30秒周期性检查SlapdServer节点的进程连接数,并把实际进程连接数和阈值相比较,当进程连接数连续多次(默认值为5)超过设定阈值(默认值为1000)时,系统将产生此告警。
-
ALM-45330 Presto Worker线程数超过阈值 - MapReduce服务 MRS
调整线程数告警触发阈值。