搜索_华为云

ALM-19020 HBase容灾等待同步的wal文件数量超过阈值 - MapReduce服务 MRS

HBase容灾等待同步的wal文件数量超过阈值告警解释系统每30秒周期性检测每个HBase服务实例RegionServer等待同步的wal文件数量。该指标可以在RegionServer角色监控界面查看，当检测到某个RegionServer上的等待同步wal文件数量超出阈值（默认连

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19035 RegionServer Call队列大小超过阈值 - MapReduce服务 MRS

ALM-19035 RegionServer Call队列大小超过阈值告警解释系统每30秒周期性检测每个HBase服务的RegionServer实例的Call队列大小，当检测到某个RegionServer上的Call队列大小连续10次超出阈值时产生该告警。当RegionSe

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-29106 Tserver进程CPU占用率过高 - MapReduce服务 MRS

ALM-29106 Tserver进程CPU占用率过高告警解释系统每60秒周期性检测Kudu的服务状态，当检测到Kudu Tserver进程CPU占用率过高时，此时产生该告警。 Tserver进程CPU占用率正常时，系统认为Kudu实例服务恢复，告警清除。告警属性告警ID

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-38005 Broker进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-38005 Broker进程垃圾回收（GC）时间超过阈值告警解释系统每60秒周期性检测Broker进程的垃圾回收（GC）占用时间，当连续3次检测到Broker进程的垃圾回收（GC）时间超出阈值（默认12秒）时，产生该告警。平滑次数为1，垃圾回收（GC）时间小于或等于

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-43008 JobHistory2x进程直接内存使用超出阈值 - MapReduce服务 MRS

ALM-43008 JobHistory2x进程直接内存使用超出阈值告警解释系统每30秒周期性检测JobHistory2x进程直接内存使用状态，当检测到JobHistory2x进程直接内存使用率超出阈值（最大内存的95%）时产生该告警。 MRS 3.3.0-LTS及之后的版本

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45009 HetuEngine计算实例任务失败率超过阈值 - MapReduce服务 MRS

HetuEngine计算实例任务失败率超过阈值本章节适用于MRS 3.5.0及以后版本。告警解释系统每30秒周期性检测HetuEngine计算实例的任务失败率，当检测到HetuEngine计算实例的任务失败率大于等于50%时产生该告警。 HetuEngine计算实例运行的任务失败率小于50%时，告警清除。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45278 RangerAdmin直接内存使用率超过阈值 - MapReduce服务 MRS

ALM-45278 RangerAdmin直接内存使用率超过阈值告警解释系统每60秒周期性检测RangerAdmin服务直接内存使用状态，当连续5次检测到RangerAdmin实例直接内存使用率超出阈值（最大内存的80%）时，产生该告警。当RangerAdmin直接内存使用率小于或等于阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-13001 ZooKeeper可用连接数不足 - MapReduce服务 MRS

ALM-13001 ZooKeeper可用连接数不足告警解释系统每60秒周期性检测ZooKeeper服务连接数状态，当检测到ZooKeeper实例连接数超出阈值（最大连接数的80%）时产生该告警。平滑次数为1，ZooKeeper可用连接数小于或等于阈值时，告警恢复；平滑次数

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-13002 ZooKeeper直接内存使用率超过阈值 - MapReduce服务 MRS

ALM-13002 ZooKeeper直接内存使用率超过阈值告警解释系统每30秒周期性检测ZooKeeper服务直接内存使用状态，当检测到ZooKeeper实例直接内存使用率超出阈值（最大内存的80%）时产生该告警。平滑次数为1，ZooKeeper直接内存使用率小于阈值时，

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18002 NodeManager心跳丢失 - MapReduce服务 MRS

ALM-18002 NodeManager心跳丢失告警解释系统每30秒周期性检测丢失的NodeManager节点，并把丢失的节点数和阈值相比较。“丢失的节点数”指标默认提供一个阈值。当检测到“丢失的节点数”的值超出阈值时产生该告警。用户可通过选择“集群 > 待操作集群的名称

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18015 JobHistoryServer直接内存使用率超过阈值 - MapReduce服务 MRS

ALM-18015 JobHistoryServer直接内存使用率超过阈值告警解释系统每30秒周期性检测MapReduce服务直接内存使用状态，当检测到JobHistoryServer实例直接内存使用率超出阈值（最大内存的90%，默认阈值）时，产生该告警。直接内存使用率小于阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-13004 ZooKeeper堆内存使用率超过阈值 - MapReduce服务 MRS

ALM-13004 ZooKeeper堆内存使用率超过阈值告警解释系统每60秒周期性检测ZooKeeper服务堆内存使用状态，当检测到ZooKeeper实例堆内存使用率超出阈值（最大内存的95%）时产生该告警。堆内存使用率小于阈值时，告警恢复。告警属性告警ID 告警级别

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18003 NodeManager不健康 - MapReduce服务 MRS

ALM-18003 NodeManager不健康告警解释系统每30秒周期性检测不健康NodeManager节点，并把不健康节点数和阈值相比较。“不健康的节点数”指标默认提供一个阈值。当检测到“不健康的节点数”的值超出阈值时产生该告警。用户可通过选择“集群 > 待操作集群的名称

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19018 HBase合并队列超出阈值 - MapReduce服务 MRS

ALM-19018 HBase合并队列超出阈值告警解释系统每30秒周期性检测HBase服务的compaction队列长度，默认当连续3次检测到HBase服务的compaction队列长度超过告警的阈值（默认100）时产生该告警。当compaction队列长度小于告警的阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
安装补丁 - MapReduce服务 MRS
安装补丁 - MapReduce服务 MRS

作。升级安装失败或者重试后仍然失败，不能直接回滚，请联系运维人员。修改配置支持HDFS单副本检测能力在MRS 3.1.0.0.2补丁以及之后的补丁中，会增加HDFS单副本检测和告警能力，新增是否允许写入单副本数据配置项“dfs.single.replication.ena

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.1.0.0.16补丁说明
ALM-12043 DNS解析时长超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-12043 DNS解析时长超过阈值（2.x及以前版本）告警解释系统每30秒周期性检测DNS解析时长，并把DNS解析时长和阈值（系统默认阈值20000ms）进行比较，当检测到DNS解析时长连续多次（默认值为2）超过阈值时产生该告警。用户可通过“系统设置 > 阈值配置 >

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19034 RegionServer WAL写入超时个数超过阈值 - MapReduce服务 MRS

ALM-19034 RegionServer WAL写入超时个数超过阈值告警解释系统每30秒周期性检测每个HBase服务的RegionServer实例的WAL写入超时个数，当检测到某个RegionServer上的WAL写入超时个数连续10次超出阈值时产生该告警。当Region

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-29107 Tserver进程内存使用百分比超过阈值 - MapReduce服务 MRS

ALM-29107 Tserver进程内存使用百分比超过阈值告警解释系统每60秒周期性检测Kudu的服务状态，当检测到Kudu Tserver进程内存使用百分比超过阈值，此时产生该告警。 Tserver进程内存使用百分比正常时，系统认为Kudu实例服务恢复，告警清除。告警属性

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-38018 Kafka消息积压 - MapReduce服务 MRS

a消息积压告警规则（默认不存在Kafka消息积压告警规则），则系统将按照如下规则进行上报：系统每60秒周期性检测所有用户配置的消费者组订阅的Topic，当连续5次检测到消费者在消费Topic时，其消费进度（offset）与该分区（partition）最新生产的消息的log end

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45003 HetuEngine QAS磁盘容量不足 - MapReduce服务 MRS

QAS磁盘容量不足本章节适用于MRS 3.3.0及以后版本。告警解释系统按60秒周期检测HetuEngine QAS磁盘空间使用率，并把实际磁盘使用率和阈值相比较。磁盘使用率默认提供一个阈值范围。当检测到磁盘使用率高于阈值时产生该告警。用户可通过“运维 > 告警 > 阈值设置”，在

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 1213

上一页
1
...
8
9
10
...
61
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-19020 HBase容灾等待同步的wal文件数量超过阈值 - MapReduce服务 MRS

ALM-19035 RegionServer Call队列大小超过阈值 - MapReduce服务 MRS

ALM-29106 Tserver进程CPU占用率过高 - MapReduce服务 MRS

ALM-38005 Broker进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-43008 JobHistory2x进程直接内存使用超出阈值 - MapReduce服务 MRS

ALM-45009 HetuEngine计算实例任务失败率超过阈值 - MapReduce服务 MRS

ALM-45278 RangerAdmin直接内存使用率超过阈值 - MapReduce服务 MRS

ALM-13001 ZooKeeper可用连接数不足 - MapReduce服务 MRS

ALM-13002 ZooKeeper直接内存使用率超过阈值 - MapReduce服务 MRS

ALM-18002 NodeManager心跳丢失 - MapReduce服务 MRS

ALM-18015 JobHistoryServer直接内存使用率超过阈值 - MapReduce服务 MRS

ALM-13004 ZooKeeper堆内存使用率超过阈值 - MapReduce服务 MRS

ALM-18003 NodeManager不健康 - MapReduce服务 MRS

ALM-19018 HBase合并队列超出阈值 - MapReduce服务 MRS

安装补丁 - MapReduce服务 MRS

ALM-12043 DNS解析时长超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-19034 RegionServer WAL写入超时个数超过阈值 - MapReduce服务 MRS

ALM-29107 Tserver进程内存使用百分比超过阈值 - MapReduce服务 MRS

ALM-38018 Kafka消息积压 - MapReduce服务 MRS

ALM-45003 HetuEngine QAS磁盘容量不足 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线