搜索_华为云

配置MRS集群告警阈值 - MapReduce服务 MRS

选择告警级别。开启“分级告警开关”后，需在“阈值设置”参数中配置告警级别。告警级别包括：紧急重要次要提示重要阈值类型选择某指标的最大值或最小值，类型为“最大值”表示指标的实际值大于设置的阈值时系统将产生告警，类型为“最小值”表示指标的实际值小于设置的阈值时系统将产生告警。最大值日期设置规则生效的日期，即哪一天运行规则。取值范围为：

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看与配置MRS告警事件
ALM-16007 Hive GC 时间超出阈值 - MapReduce服务 MRS

时间超出阈值告警解释系统每60秒周期性检测Hive服务的GC时间，当检测到Hive服务的GC时间超出阈值(连续3次检测超过12秒)时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称 > Hive”修改阈值。当Hive GC时间小于或等于阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
MRS集群阈值类告警配置说明 - MapReduce服务 MRS

0及之后版本集群开启“分级告警开关”后，可以在“阈值设置”参数中配置告警级别。紧急重要次要提示重要阈值类型选择某指标的最大值或最小值。最大值：表示指标的实际值大于设置的阈值时系统将产生告警。最小值：表示指标的实际值小于设置的阈值时系统将产生告警。最大值日期设置规则生效的日期，即哪一

 帮助中心 > MapReduce服务 MRS > 最佳实践 > MRS集群管理
ALM-16003 Background线程使用率超过阈值 - MapReduce服务 MRS

ALM-16003 Background线程使用率超过阈值告警解释系统每30秒周期性检测Background线程使用率情况，默认阈值为90%。如果Hive使用的background线程池使用率超过阈值，则发出告警。告警属性告警ID 告警级别是否自动清除 16003 重要

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19017 在ZooKeeper上的容量配额使用率超过阈值 - MapReduce服务 MRS

在ZooKeeper上的容量配额使用率超过阈值告警解释系统每120秒周期性检测HBase服务的znode使用情况，当检测到HBase服务的znode容量使用率超出告警的阈值（默认75%）时产生该告警。当znode的容量使用率小于告警的阈值时，告警恢复。告警属性告警ID 告警级别

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12050 网络写吞吐率超过阈值 - MapReduce服务 MRS

ALM-12050 网络写吞吐率超过阈值告警解释系统每30秒周期性检测网络写吞吐率，并把实际吞吐率和阈值（系统默认阈值80%）进行比较，当检测到网络写吞吐率连续多次（默认值为5）超过阈值时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称 > 主机 >

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12049 网络读吞吐率超过阈值 - MapReduce服务 MRS

ALM-12049 网络读吞吐率超过阈值告警解释系统每30秒周期性检测网络读吞吐率，并把实际吞吐率和阈值（系统默认阈值80%）进行比较，当检测到网络读吞吐率连续多次（默认值为5）超过阈值时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称 > 主机 >

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14003 丢失的HDFS块数量超过阈值 - MapReduce服务 MRS

丢失的HDFS块数量超过阈值告警解释系统每30秒周期性检测丢失的块数量，并把丢失的块数量和阈值相比较。丢失的块数量指标默认提供一个阈值范围。当检测到丢失的HDFS块数量超出阈值范围时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称 > HDFS”修改阈值。平滑次

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14008 DataNode堆内存使用率超过阈值 - MapReduce服务 MRS

用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称 > HDFS”修改阈值。平滑次数为1，HDFS DataNode堆内存使用率小于或等于阈值时，告警恢复；平滑次数大于1，HDFS DataNode堆内存使用率小于或等于阈值的90%时，告警恢复。告警属性告警ID

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18010 Yarn任务挂起数超过阈值（2.x及以前版本） - MapReduce服务 MRS

Yarn任务挂起数超过阈值（2.x及以前版本）告警解释系统每30秒周期性检查YARN服务处于挂起状态（Pending）的任务数量，并把挂起状态的任务数量和阈值进行比较。当检测到挂起状态的任务数超过阈值时产生该告警。用户可通过在MRS Manager中的“系统设置 > 阈值配置 > 服务

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14009 Dead DataNode数量超过阈值 - MapReduce服务 MRS

警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称 > HDFS”修改阈值。平滑次数为1，故障状态的DataNode数量小于或等于阈值时，告警恢复；平滑次数大于1，故障状态的DataNode数量小于或等于阈值的90%时，告警恢复。告警属性告警ID 告警级别

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
MetaStore动态分区数超出阈值导致SQL报错 - MapReduce服务 MRS

MetaStore动态分区数超出阈值导致SQL报错现象描述执行SparkSQL或HiveSQL命令时，系统报错如下： Number of dynamic partitions created is 2001, which is more than 2000. To slove

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
ALM-12027 主机PID使用率超过阈值 - MapReduce服务 MRS

主机PID使用率超过阈值告警解释系统每30秒周期性检测PID使用率，并把实际PID使用率和阈值进行比较，PID使用率默认提供一个阈值。当检测到PID使用率超出阈值时产生该告警。平滑次数为1，主机PID使用率小于或等于阈值时，告警恢复；平滑次数大于1，主机PID使用率小于或等于阈值的90%时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19018 HBase合并队列超出阈值 - MapReduce服务 MRS

HBase合并队列超出阈值告警解释系统每30秒周期性检测HBase服务的compaction队列长度，默认当连续3次检测到HBase服务的compaction队列长度超过告警的阈值（默认100）时产生该告警。当compaction队列长度小于告警的阈值时，告警恢复。告警属性

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14016 DataNode直接内存使用率超过阈值 - MapReduce服务 MRS

ALM-14016 DataNode直接内存使用率超过阈值告警解释系统每30秒周期性检测HDFS服务直接内存使用状态，当检测到DataNode实例直接内存使用率超出阈值（最大内存的90%）时，产生该告警。直接内存使用率小于阈值时，告警恢复。告警属性告警ID 告警级别是否自动清除

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18024 Yarn任务挂起内存量超阈值 - MapReduce服务 MRS

应用任务结束时间变长。新应用提交后长时间无法运行。可能原因 NodeManager节点资源过小。队列最大资源容量设置过小，AM最大资源百分比设置过小。监控阈值设置过小。处理步骤检查NodeManager节点资源在FusionInsight Manager界面，选择“集群

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12028 主机D状态和Z状态进程数超过阈值 - MapReduce服务 MRS

主机D状态和Z状态进程数超过阈值告警解释系统每30秒周期性检测主机中omm用户D状态和Z状态进程数，并把实际进程数和阈值相比较。主机D状态和Z状态进程数默认提供一个阈值范围。当检测到进程数超出阈值范围时产生该告警。平滑次数为1，主机中omm用户D状态和Z状态进程总数小于或等于阈值时，告警恢复

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18023 Yarn任务挂起数超过阈值 - MapReduce服务 MRS

应用任务结束时间变长。新应用提交后长时间无法运行。可能原因 NodeManager节点资源过小。队列最大资源容量设置过小，AM最大资源百分比设置过小。监控阈值设置过小。处理步骤检查NodeManager节点资源在FusionInsight Manager界面，选择“集群

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-29014 Catalog FGCT超过阈值 - MapReduce服务 MRS

condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 FGC时间超出阈值，会影响到数据的读写。可能原因该节点实例内存使用率过大，或配置的堆内存不合理，导致进程GC频繁。处理步骤检查GC时间用户可通过“运维> 告警 > 阈值设置 > 待操作集群的名称 > Impala

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-29013 Impalad FGCT超过阈值 - MapReduce服务 MRS

condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 FGC时间超出阈值，会影响到数据的读写。可能原因该节点实例内存使用率过大，或配置的堆内存不合理，导致进程GC频繁。处理步骤检查GC时间用户可通过“运维> 告警 > 阈值设置 > Impala> 进程FGCT >Impalad进程FGCT（

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 2542

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置MRS集群告警阈值 - MapReduce服务 MRS

ALM-16007 Hive GC 时间超出阈值 - MapReduce服务 MRS

MRS集群阈值类告警配置说明 - MapReduce服务 MRS

ALM-16003 Background线程使用率超过阈值 - MapReduce服务 MRS

ALM-19017 在ZooKeeper上的容量配额使用率超过阈值 - MapReduce服务 MRS

ALM-12050 网络写吞吐率超过阈值 - MapReduce服务 MRS

ALM-12049 网络读吞吐率超过阈值 - MapReduce服务 MRS

ALM-14003 丢失的HDFS块数量超过阈值 - MapReduce服务 MRS

ALM-14008 DataNode堆内存使用率超过阈值 - MapReduce服务 MRS

ALM-18010 Yarn任务挂起数超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-14009 Dead DataNode数量超过阈值 - MapReduce服务 MRS

MetaStore动态分区数超出阈值导致SQL报错 - MapReduce服务 MRS

ALM-12027 主机PID使用率超过阈值 - MapReduce服务 MRS

ALM-19018 HBase合并队列超出阈值 - MapReduce服务 MRS

ALM-14016 DataNode直接内存使用率超过阈值 - MapReduce服务 MRS

ALM-18024 Yarn任务挂起内存量超阈值 - MapReduce服务 MRS

ALM-12028 主机D状态和Z状态进程数超过阈值 - MapReduce服务 MRS

ALM-18023 Yarn任务挂起数超过阈值 - MapReduce服务 MRS

ALM-29014 Catalog FGCT超过阈值 - MapReduce服务 MRS

ALM-29013 Impalad FGCT超过阈值 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线