搜索_华为云

ALM-12040 系统熵值不足 - MapReduce服务 MRS

是否自动清除 12040 重要是告警参数参数名称参数含义来源产生告警的集群或系统名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响节点的操作系统熵值不足，可能导致该节点上加解密等命令执行慢，进而引起各实例业务处理性能下降，甚至业务进程无法正常执行。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12010 Manager主备节点间心跳中断 - MapReduce服务 MRS

产生告警的集群或系统名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响如果主Manager进程资源异常，主备倒换无法进行，影响运维基本功能使用。可能原因主备Manager节点间链路异常。节点名配置错误。防火墙禁用端口。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-38009 Kafka Topic过载（适用于MRS 3.1.0及之前版本） - MapReduce服务 MRS

参数名称参数含义来源产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。主题名产生告警的Kafka Topic。对系统的影响 Partition所在的磁盘分区IO过于繁忙，产生告警的Kafka Topic上可能无法写入数据。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12063 磁盘不可用 - MapReduce服务 MRS

参数名称参数含义来源产生告警的集群或系统名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。磁盘名产生告警的磁盘名称。对系统的影响业务失败：磁盘不可写或不可读时，如果需要修改或使用该磁盘上的数据，可能会导致作业运行失败。可能原因

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19026 HBase存在损坏的WAL文件 - MapReduce服务 MRS

19026 重要是告警参数参数名称参数含义来源产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响 HBase存在损坏的WAL文件，如果位于该文件上的数据未落盘，会导致这部分数据丢失，业务查询数据时出现部分数据不一致。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
NameNode节点存在ALM-12027主机PID使用率超过阈值告警 - MapReduce服务 MRS

NameNode节点存在ALM-12027主机PID使用率超过阈值告警问题背景与现象 3.1.2及之前的3.x版本集群，NameNode节点存在ALM-12027主机PID使用率超过阈值告警，节点Java进程可能出现“unable to create new native thread”报错。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
ALM-14028 待补齐的块数超过阈值 - MapReduce服务 MRS

来源产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。 NameService名产生告警的NameService名称。 Trigger condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 HDF

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-38010 存在单副本的Topic - MapReduce服务 MRS

参数名称参数含义来源产生告警的集群名称。角色名产生告警的角色名称。主题名产生告警的Topic名称列表。对系统的影响单副本的Topic存在单点故障风险，当副本所在节点异常时，会直接导致Partition没有leader，影响该Topic上的业务。可能原因 Topic副本数配置不合理。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14000 HDFS服务不可用 - MapReduce服务 MRS

是否自动清除 14000 紧急是告警参数参数名称参数含义来源产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响无法为基于HDFS服务的HBase和MapReduce等上层部件提供服务。用户无法读写文件。可能原因

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12007 进程故障（2.x及以前版本） - MapReduce服务 MRS

ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。对系统的影响该进程提供的业务不可用。可能原因实例进程异常。磁盘空间不足。处理步骤检查实例进程是否异常。打开MRS集群详情页面，在告警管理页签的告警列表中，单击

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14029 单副本的块数超过阈值 - MapReduce服务 MRS

ALM-14029 单副本的块数超过阈值告警解释系统每4个小时周期性检测单副本块的数量，并把当前单副本的块数和阈值相比较。单副本的块数量指标默认提供一个阈值范围。当检测到单副本的块数量超出阈值范围时产生该告警。待补齐的块数量小于阈值时，告警恢复。告警属性告警ID 告警级别

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
集群出现ALM-14012 Journalnode数据不同步告警 - MapReduce服务 MRS

集群出现ALM-14012 Journalnode数据不同步告警问题背景与现象 MRS集群出现ALM-14012 Journalnode数据不同步告警。原因分析登录告警节点，查找日志路径“/var/log/Bigdata/hdfs/nn”下Journalnode实例的startDetail

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
ALM-12012 NTP服务异常 - MapReduce服务 MRS

是告警参数参数名称参数含义来源产生告警的集群或系统名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响该节点的时间与集群其他节点的时间不同步，可能会导致该节点上的某些FusionInsight应用无法正常运行。如

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12012 NTP服务异常（2.x及以前版本） - MapReduce服务 MRS

ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。对系统的影响该节点的时间与集群其它节点的时间不同步，可能会导致该节点上的某些MRS应用无法正常运行。可能原因该节点的NTP服务无法正常启动。该节点与

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14003 丢失的HDFS块数量超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-14003 丢失的HDFS块数量超过阈值（2.x及以前版本）告警解释系统每30秒周期性检测丢失的块数量，并把丢失的块数量和阈值相比较。丢失的块数量指标默认提供一个阈值范围。当检测到丢失的块数量超出阈值范围时产生该告警。当丢失的块数量小于或等于阈值时，告警恢复。告警属性

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45646 RocksDB的Pending Compaction持续超过阈值 - MapReduce服务 MRS

来源产生告警的集群名称。服务名产生告警的服务名称。应用名产生告警的应用名称。角色名产生告警的角色名称。任务名产生告警的作业名称。对系统的影响 Flink作业RocksDB的Pending Compaction持续超过阈值，主要反应的是Flink作业的CheckP

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14003 丢失的HDFS块数量超过阈值 - MapReduce服务 MRS

ALM-14003 丢失的HDFS块数量超过阈值告警解释系统每30秒周期性检测丢失的块数量，并把丢失的块数量和阈值相比较。丢失的块数量指标默认提供一个阈值范围。当检测到丢失的HDFS块数量超出阈值范围时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
MRS集群反复上报43006告警 - MapReduce服务 MRS

用户问题集群反复出现“ALM-43006 JobHistory进程堆内存使用超出阈值”告警，且按照告警参考处理无效。问题现象集群出现告警“ALM-43006 JobHistory进程堆内存使用超出阈值”并且按照指导处理以后，运行一段时间又会出现同样的告警。原因分析可能存

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
ALM-18000 Yarn服务不可用 - MapReduce服务 MRS

产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响集群无法提供Yarn服务。用户无法执行新的application。已提交的application无法执行。可能原因 ZooKeeper服务异常。 HDFS服务异常。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19025 HBase存在损坏的StoreFile文件 - MapReduce服务 MRS

是告警参数参数名称参数含义来源产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响 HBase存在损坏的StoreFile文件，可能会导致位于该文件上的数据丢失，业务查询数据可能出现不一致。可能原因

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 635

上一页
1
2
3
4
5
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-12040 系统熵值不足 - MapReduce服务 MRS

ALM-12010 Manager主备节点间心跳中断 - MapReduce服务 MRS

ALM-38009 Kafka Topic过载（适用于MRS 3.1.0及之前版本） - MapReduce服务 MRS

ALM-12063 磁盘不可用 - MapReduce服务 MRS

ALM-19026 HBase存在损坏的WAL文件 - MapReduce服务 MRS

NameNode节点存在ALM-12027主机PID使用率超过阈值告警 - MapReduce服务 MRS

ALM-14028 待补齐的块数超过阈值 - MapReduce服务 MRS

ALM-38010 存在单副本的Topic - MapReduce服务 MRS

ALM-14000 HDFS服务不可用 - MapReduce服务 MRS

ALM-12007 进程故障（2.x及以前版本） - MapReduce服务 MRS

ALM-14029 单副本的块数超过阈值 - MapReduce服务 MRS

集群出现ALM-14012 Journalnode数据不同步告警 - MapReduce服务 MRS

ALM-12012 NTP服务异常 - MapReduce服务 MRS

ALM-12012 NTP服务异常（2.x及以前版本） - MapReduce服务 MRS

ALM-14003 丢失的HDFS块数量超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-45646 RocksDB的Pending Compaction持续超过阈值 - MapReduce服务 MRS

ALM-14003 丢失的HDFS块数量超过阈值 - MapReduce服务 MRS

MRS集群反复上报43006告警 - MapReduce服务 MRS

ALM-18000 Yarn服务不可用 - MapReduce服务 MRS

ALM-19025 HBase存在损坏的StoreFile文件 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线