搜索_华为云

ALM-45428 ClickHouse磁盘IO异常 - MapReduce服务 MRS

执行命令smartctl -a /dev/sd故障磁盘，进行磁盘检测，其中“故障磁盘”为3查询到的磁盘。若检测结果如下图所示，其中“SMART Health Status: OK”，表示当前磁盘是健康的，执行6。若检测结果如下图所示，其中“Elements in grown defect

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45652 Flink服务不可用 - MapReduce服务 MRS

ALM-45652 Flink服务不可用本章节适用于MRS 3.3.0及以后版本。告警解释告警模块按60秒周期检测Flink服务状态。当检测到Flink服务不可用时产生该告警。Flink服务恢复时，告警恢复。告警属性告警ID 告警级别是否可自动清除 45652 紧急是

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-13008 ZooKeeper Znode数量使用率超出阈值 - MapReduce服务 MRS

ZooKeeper Znode数量使用率超出阈值告警解释系统每小时（MRS 3.5.0及之后版本为“每10分钟”）周期性检测ZooKeeper服务数据目录下二级znode状态，当检测到二级znode的总数量超过阈值时产生该告警。告警属性告警ID 告警级别是否自动清除 13008 重要是

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14000 HDFS服务不可用 - MapReduce服务 MRS

ALM-14000 HDFS服务不可用告警解释系统每60秒周期性检测NameService的服务状态，当检测到所有的NameService服务都异常时，就会认为HDFS服务不可用，此时产生该告警。至少一个NameService服务正常后，系统认为HDFS服务恢复，告警清除。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18000 Yarn服务不可用 - MapReduce服务 MRS

ALM-18000 Yarn服务不可用告警解释告警模块按60秒周期检测Yarn服务状态。当检测到Yarn服务不可用时产生该告警。 Yarn服务恢复时，告警恢复。告警属性告警ID 告警级别是否自动清除 18000 紧急是告警参数参数名称参数含义来源产生告警的集群名称。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18011 NodeManager进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-18011 NodeManager进程垃圾回收（GC）时间超过阈值告警解释系统每60秒周期性检测NodeManager进程的垃圾回收（GC）占用时间，当检测到NodeManager进程的垃圾回收（GC）时间超出阈值（默认12秒）时，产生该告警。垃圾回收（GC）时间小于阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19011 RegionServer的Region数量超出阈值 - MapReduce服务 MRS

RegionServer的Region数量超出阈值告警解释系统每30秒周期性检测每个HBase服务实例中每个RegionServer的Region数。该指标可以在HBase服务监控界面和RegionServer角色监控界面查看，当检测到某个RegionServer上的Region数超出阈值（默认

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14014 NameNode进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-14014 NameNode进程垃圾回收（GC）时间超过阈值告警解释系统每60秒周期性检测NameNode进程的垃圾回收（GC）占用时间，当检测到NameNode进程的垃圾回收（GC）时间超出阈值（默认12秒）时，产生该告警。垃圾回收（GC）时间小于阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14015 DataNode进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-14015 DataNode进程垃圾回收（GC）时间超过阈值告警解释系统每60秒周期性检测DataNode进程的垃圾回收（GC）占用时间，当检测到DataNode进程的垃圾回收（GC）时间超出阈值（默认12秒）时，产生该告警。垃圾回收（GC）时间小于阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-26052 Storm服务可用Supervisor数量小于阈值 - MapReduce服务 MRS

ALM-26052 Storm服务可用Supervisor数量小于阈值告警解释系统每60秒周期性检测Supervisor数量，并把实际Supervisor数量和阈值相比较。当检测到Supervisor数量低于阈值时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称”修改阈值。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-38009 Broker磁盘IO繁忙（适用于MRS 3.1.0之后版本） - MapReduce服务 MRS

ALM-38009 Broker磁盘IO繁忙（适用于MRS 3.1.0之后版本）告警解释系统每60秒周期性检测Kafka各个磁盘的IO情况，当检测到某个Broker上的Kafka数据目录磁盘IO超出阈值（默认80%）时，产生该告警。平滑次数为3，当该磁盘IO低于阈值（默认80%）时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45005 HetuEngine计算实例CPU负载使用率超过阈值 - MapReduce服务 MRS

HetuEngine计算实例CPU负载使用率超过阈值本章节适用于MRS 3.3.1及以后版本。告警解释系统每30秒周期性检测HetuEngine计算实例的平均CPU负载使用率，当检测到HetuEngine计算实例的CPU负载使用率大于90%时产生该告警。 HetuEngine计算实例运行的C

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-43008 JobHistory进程直接内存使用超出阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-43008 JobHistory进程直接内存使用超出阈值（2.x及以前版本）告警解释系统每30秒周期性检测JobHistory进程直接内存使用状态，当检测到JobHistory进程直接内存使用率超出阈值（最大内存的90%）时产生该告警。告警属性告警ID 告警级别可自动清除

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-13004 ZooKeeper堆内存使用率超过阈值 - MapReduce服务 MRS

ALM-13004 ZooKeeper堆内存使用率超过阈值告警解释系统每60秒周期性检测ZooKeeper服务堆内存使用状态，当检测到ZooKeeper实例堆内存使用率超出阈值（最大内存的95%）时产生该告警。堆内存使用率小于阈值时，告警恢复。告警属性告警ID 告警级别

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18003 NodeManager不健康 - MapReduce服务 MRS

ALM-18003 NodeManager不健康告警解释系统每30秒周期性检测不健康NodeManager节点，并把不健康节点数和阈值相比较。“不健康的节点数”指标默认提供一个阈值。当检测到“不健康的节点数”的值超出阈值时产生该告警。用户可通过选择“集群 > 待操作集群的名称

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18013 ResourceManager直接内存使用率超过阈值 - MapReduce服务 MRS

ALM-18013 ResourceManager直接内存使用率超过阈值告警解释系统每30秒周期性检测ResourceManager服务直接内存使用状态，当检测到ResourceManager实例直接内存使用率超出阈值（最大内存的90%）时，产生该告警。直接内存使用率小于阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19018 HBase合并队列超出阈值 - MapReduce服务 MRS

ALM-19018 HBase合并队列超出阈值告警解释系统每30秒周期性检测HBase服务的compaction队列长度，默认当连续3次检测到HBase服务的compaction队列长度超过告警的阈值（默认100）时产生该告警。当compaction队列长度小于告警的阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19034 RegionServer WAL写入超时个数超过阈值 - MapReduce服务 MRS

ALM-19034 RegionServer WAL写入超时个数超过阈值告警解释系统每30秒周期性检测每个HBase服务的RegionServer实例的WAL写入超时个数，当检测到某个RegionServer上的WAL写入超时个数连续10次超出阈值时产生该告警。当Region

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-23007 Loader进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-23007 Loader进程垃圾回收（GC）时间超过阈值告警解释系统每60秒周期性检测Loader进程的垃圾回收（GC）占用时间，当连续5次检测到Loader进程的垃圾回收（GC）时间超出阈值（默认12秒）时，产生该告警。垃圾回收（GC）时间小于阈值时，告警恢复。告警属性

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-38007 Kafka默认用户状态异常 - MapReduce服务 MRS

ALM-38007 Kafka默认用户状态异常告警解释系统每60秒周期性检测Kafka服务默认用户，当检测到该用户异常时发送此告警。平滑次数为1，当用户状态恢复后，告警恢复。告警属性告警ID 告警级别是否自动清除 38007 紧急是告警参数参数名称参数含义来源

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 602

上一页
1
...
6
7
8
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-45428 ClickHouse磁盘IO异常 - MapReduce服务 MRS

ALM-45652 Flink服务不可用 - MapReduce服务 MRS

ALM-13008 ZooKeeper Znode数量使用率超出阈值 - MapReduce服务 MRS

ALM-14000 HDFS服务不可用 - MapReduce服务 MRS

ALM-18000 Yarn服务不可用 - MapReduce服务 MRS

ALM-18011 NodeManager进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-19011 RegionServer的Region数量超出阈值 - MapReduce服务 MRS

ALM-14014 NameNode进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-14015 DataNode进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-26052 Storm服务可用Supervisor数量小于阈值 - MapReduce服务 MRS

ALM-38009 Broker磁盘IO繁忙（适用于MRS 3.1.0之后版本） - MapReduce服务 MRS

ALM-45005 HetuEngine计算实例CPU负载使用率超过阈值 - MapReduce服务 MRS

ALM-43008 JobHistory进程直接内存使用超出阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-13004 ZooKeeper堆内存使用率超过阈值 - MapReduce服务 MRS

ALM-18003 NodeManager不健康 - MapReduce服务 MRS

ALM-18013 ResourceManager直接内存使用率超过阈值 - MapReduce服务 MRS

ALM-19018 HBase合并队列超出阈值 - MapReduce服务 MRS

ALM-19034 RegionServer WAL写入超时个数超过阈值 - MapReduce服务 MRS

ALM-23007 Loader进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-38007 Kafka默认用户状态异常 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线