搜索_华为云

ALM-14022 NameNode RPC队列平均时间超过阈值 - MapReduce服务 MRS

ALM-14022 NameNode RPC队列平均时间超过阈值告警解释系统每30秒周期性检测NameNode的RPC队列平均时间，并把实际的NameNode的RPC队列平均时间和阈值（默认为200ms）相比较。当检测到NameNode的RPC队列平均时间连续多次（默认为10次）超出阈值范围时，产生该告警。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19020 HBase容灾等待同步的wal文件数量超过阈值 - MapReduce服务 MRS

HBase容灾等待同步的wal文件数量超过阈值告警解释系统每30秒周期性检测每个HBase服务实例RegionServer等待同步的wal文件数量。该指标可以在RegionServer角色监控界面查看，当检测到某个RegionServer上的等待同步wal文件数量超出阈值（默认连

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45280 RangerAdmin垃圾回收(GC)时间超过阈值 - MapReduce服务 MRS

ALM-45280 RangerAdmin垃圾回收(GC)时间超过阈值告警解释系统每60秒周期性检测RangerAdmin进程的垃圾回收（GC）占用时间，当连续5次检测到RangerAdmin进程的垃圾回收（GC）时间超出阈值（默认12秒）时，产生该告警。垃圾回收（GC）时间小于阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-47002 MemArtsCC磁盘故障 - MapReduce服务 MRS

ALM-47002 MemArtsCC磁盘故障本章节仅适用于MRS 3.3.1及之后版本。告警解释告警模块按60秒周期检测MemArtsCC使用的本地盘状态，当检测到磁盘状态异常会触发告警。当磁盘恢复正常后，告警恢复。告警属性告警ID 告警级别是否可自动清除 47002 重要

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18000 Yarn服务不可用（2.x及以前版本） - MapReduce服务 MRS

ALM-18000 Yarn服务不可用（2.x及以前版本）告警解释告警模块按30秒周期检测Yarn服务状态。当检测到Yarn服务不可用时产生该告警。 Yarn服务恢复时，告警恢复。告警属性告警ID 告警级别可自动清除 18000 致命是告警参数参数名称参数含义 ServiceName

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19035 RegionServer Call队列大小超过阈值 - MapReduce服务 MRS

ALM-19035 RegionServer Call队列大小超过阈值告警解释系统每30秒周期性检测每个HBase服务的RegionServer实例的Call队列大小，当检测到某个RegionServer上的Call队列大小连续10次超出阈值时产生该告警。当RegionSe

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18002 NodeManager心跳丢失 - MapReduce服务 MRS

ALM-18002 NodeManager心跳丢失告警解释系统每30秒周期性检测丢失的NodeManager节点，并把丢失的节点数和阈值相比较。“丢失的节点数”指标默认提供一个阈值。当检测到“丢失的节点数”的值超出阈值时产生该告警。用户可通过选择“集群 > 待操作集群的名称

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18020 Yarn任务执行超时 - MapReduce服务 MRS

ALM-18020 Yarn任务执行超时告警解释系统每15分钟周期性检测提交到Yarn上的Mapreduce和Spark应用任务（JDBC常驻任务除外），当检测到任务执行时间超过用户指定的超时时间时，产生该告警，但任务仍继续正常执行。其中，Mapreduce的客户端超时参数为“mapreduce

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45479 Tserver进程tablet数量超过阈值 - MapReduce服务 MRS

ALM-45479 Tserver进程tablet数量超过阈值告警解释系统每60秒周期性检测Kudu的服务状态，当检测到Tserver进程tablet数量过高时，此时产生该告警。 Tserver进程tablet数量正常时，系统认为Kudu实例服务恢复，告警清除。告警属性告警ID

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12050 网络写吞吐率超过阈值 - MapReduce服务 MRS

ALM-12050 网络写吞吐率超过阈值告警解释系统每30秒周期性检测网络写吞吐率，并把实际吞吐率和阈值（系统默认阈值80%）进行比较，当检测到网络写吞吐率连续多次（默认值为5）超过阈值时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称 > 主机 >

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12051 磁盘Inode使用率超过阈值 - MapReduce服务 MRS

ALM-12051 磁盘Inode使用率超过阈值告警解释系统每30秒周期性检测磁盘Inode使用率，并把实际Inode使用率和阈值（系统默认阈值80%）进行比较，当检测到Inode使用率连续多次（默认值为5）超过阈值时产生该告警。用户可通过“运维 > 告警 > 阈值设置 >

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12053 主机文件句柄使用率超过阈值 - MapReduce服务 MRS

ALM-12053 主机文件句柄使用率超过阈值告警解释系统每30秒周期性检测主机文件句柄使用率，并把实际使用率和阈值（系统默认阈值80%）进行比较，当检测到主机文件句柄使用率连续多次（默认值为5）超过阈值时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14002 DataNode磁盘空间使用率超过阈值 - MapReduce服务 MRS

ALM-14002 DataNode磁盘空间使用率超过阈值告警解释系统每30秒周期性检测DataNode磁盘空间使用率，并把实际磁盘使用率和阈值相比较。DataNode磁盘空间使用率指标默认提供一个阈值范围。当检测到DataNode磁盘空间使用率指标超出阈值范围时产生该告警。用户可通过“运维

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19013 region处在RIT状态的时长超过阈值 - MapReduce服务 MRS

ALM-19013 region处在RIT状态的时长超过阈值告警解释系统按300秒周期性检测HBase上的region处在RIT状态的数量。当检测到处在RIT状态的region时长超过阈值时长（连续两次超过阈值），上报该告警。当处在超时状态的region都恢复后，告警恢复。告警属性

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19030 RegionServer的RPC请求处理时间的P99超过阈值 - MapReduce服务 MRS

ALM-19030 RegionServer的RPC请求处理时间的P99超过阈值告警解释系统每30秒周期性检测每个HBase服务的RegionServer实例的RPC请求处理时间的P99，当检测到某个RegionServer上的RPC请求处理时间的P99连续10次超出阈值时产生该告警。当

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19033 RegionServer的RPC读队列数超过阈值 - MapReduce服务 MRS

ALM-19033 RegionServer的RPC读队列数超过阈值告警解释系统每30秒周期性检测每个HBase服务的RegionServer实例的RPC读队列待处理任务个数，当检测到某个RegionServer上的RPC读队列待处理任务个数连续10次超出阈值时产生该告警。当

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-29107 Tserver进程内存使用百分比超过阈值 - MapReduce服务 MRS

ALM-29107 Tserver进程内存使用百分比超过阈值告警解释系统每60秒周期性检测Kudu的服务状态，当检测到Kudu Tserver进程内存使用百分比超过阈值，此时产生该告警。 Tserver进程内存使用百分比正常时，系统认为Kudu实例服务恢复，告警清除。告警属性

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-38006 Kafka未完全同步的Partition百分比超过阈值 - MapReduce服务 MRS

ALM-38006 Kafka未完全同步的Partition百分比超过阈值告警解释系统每60秒周期性检测Kafka服务未完全同步的Partition数占Partition总数的百分比，当连续3次检测到该比率超出阈值（默认50%）时产生该告警。平滑次数为1，未完全同步的Partition百

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-38018 Kafka消息积压 - MapReduce服务 MRS

a消息积压告警规则（默认不存在Kafka消息积压告警规则），则系统将按照如下规则进行上报：系统每60秒周期性检测所有用户配置的消费者组订阅的Topic，当连续5次检测到消费者在消费Topic时，其消费进度（offset）与该分区（partition）最新生产的消息的log end

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45003 HetuEngine QAS磁盘容量不足 - MapReduce服务 MRS

QAS磁盘容量不足本章节适用于MRS 3.3.0及以后版本。告警解释系统按60秒周期检测HetuEngine QAS磁盘空间使用率，并把实际磁盘使用率和阈值相比较。磁盘使用率默认提供一个阈值范围。当检测到磁盘使用率高于阈值时产生该告警。用户可通过“运维 > 告警 > 阈值设置”，在

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 588

上一页
1
...
8
9
10
...
30
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-14022 NameNode RPC队列平均时间超过阈值 - MapReduce服务 MRS

ALM-19020 HBase容灾等待同步的wal文件数量超过阈值 - MapReduce服务 MRS

ALM-45280 RangerAdmin垃圾回收(GC)时间超过阈值 - MapReduce服务 MRS

ALM-47002 MemArtsCC磁盘故障 - MapReduce服务 MRS

ALM-18000 Yarn服务不可用（2.x及以前版本） - MapReduce服务 MRS

ALM-19035 RegionServer Call队列大小超过阈值 - MapReduce服务 MRS

ALM-18002 NodeManager心跳丢失 - MapReduce服务 MRS

ALM-18020 Yarn任务执行超时 - MapReduce服务 MRS

ALM-45479 Tserver进程tablet数量超过阈值 - MapReduce服务 MRS

ALM-12050 网络写吞吐率超过阈值 - MapReduce服务 MRS

ALM-12051 磁盘Inode使用率超过阈值 - MapReduce服务 MRS

ALM-12053 主机文件句柄使用率超过阈值 - MapReduce服务 MRS

ALM-14002 DataNode磁盘空间使用率超过阈值 - MapReduce服务 MRS

ALM-19013 region处在RIT状态的时长超过阈值 - MapReduce服务 MRS

ALM-19030 RegionServer的RPC请求处理时间的P99超过阈值 - MapReduce服务 MRS

ALM-19033 RegionServer的RPC读队列数超过阈值 - MapReduce服务 MRS

ALM-29107 Tserver进程内存使用百分比超过阈值 - MapReduce服务 MRS

ALM-38006 Kafka未完全同步的Partition百分比超过阈值 - MapReduce服务 MRS

ALM-38018 Kafka消息积压 - MapReduce服务 MRS

ALM-45003 HetuEngine QAS磁盘容量不足 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线