搜索_华为云

ALM-45617 CDL复制槽Slot积压数据量超过阈值 - MapReduce服务 MRS

空间耗尽，最终导致PostgreSQL或Opengauss数据库无法提供服务。可能原因 CDL任务异常，数据停止处理；或源端数据库更新快，CDL数据处理较慢。处理步骤使用具有创建CDL任务的用户或者具有管理员权限的用户登录FusionInsight Manager。选择“运维

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-50217 FE节点堆内存的使用率超过阈值 - MapReduce服务 MRS

Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响影响任务执行和客户端连接FE。可能原因 FE堆内存过小。处理步骤检查堆内存使用率。登录FusionInsight Manager，选择“运维 > 告警 > 阈值设置 > 待操作集群的名称 > Doris

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-38013 Produce请求在请求队列的时延超过阈值 - MapReduce服务 MRS

务，可能会导致大量的业务写入请求超时。可能原因 Broker用于处理请求的线程数配置不合理。慢盘故障。 Broker磁盘IO繁忙。 Broker的分区分布不均匀，存在热点。处理步骤检查Broker用于处理请求的线程数配置是否不合理。登录FusionInsight Manager，选择“集群

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-43018 JobHistory2x进程Full GC次数超出阈值 - MapReduce服务 MRS

rk任务历史执行记录。可能原因该节点JobHistory2x进程堆内存使用率过大，或配置的堆内存不合理，导致进程Full GC频繁。处理步骤检查Full GC次数在FusionInsight Manager首页，选择“运维 > 告警 > 告警”，选中“告警ID”为“43

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14006 HDFS文件数超过阈值（2.x及以前版本） - MapReduce服务 MRS

File”监控项查看。等待5分钟后，检查本告警是否清除。是，处理完毕。否，执行3。收集故障信息。在MRS Manager界面，单击“系统设置 > 日志导出”。请联系运维人员，并发送已收集的故障日志信息。参考信息无。父主题： MRS集群告警处理参考

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18002 NodeManager心跳丢失（2.x及以前版本） - MapReduce服务 MRS

NodeManager和ResourceManager之间的网络断连或者繁忙。处理步骤收集故障信息。在MRS Manager界面，单击“系统设置 > 日志导出”。请联系运维人员，并发送已收集的故障日志信息。参考信息无。父主题： MRS集群告警处理参考

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45329 Presto Coordinator资源组排队任务超过阈值 - MapReduce服务 MRS

资源组排队数超过该组最大排队数（maxQueued）时，会导致新的任务无法执行。可能原因资源组配置不合理或该资源组下提交的任务过多。处理步骤选择“集群 > 待操作集群的名称 > 服务 > Presto > 配置 > 全部配置”，修改“resource-groups”的值调整资源组配置，修改“

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45434 ClickHouse组件数据表中存在单副本 - MapReduce服务 MRS

ClickHouse组件中存在单副本，当出现硬件故障时，无法恢复数据。可能原因 ClickHouse节点其组件配置目录下的metrika.xml配置信息中存在单副本配置。处理步骤检查ClickHouse实例metrika.xml配置是否正常在FusionInsight Manager页面告警列表中，单击此告

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45591 ConfigNode直接内存使用率超过阈值 - MapReduce服务 MRS

直接内存溢出可能导致IoTDB实例不可用，可能影响该ConfigNode进程无法正常提供数据读写服务。可能原因节点配置的直接内存不合理，导致使用率超过阈值。处理步骤检查直接内存配置。在FusionInsight Manager首页，选择“运维 > 告警 > 告警”，在实时告警列表中，单击此告警

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45592 IoTDBServer RPC执行时长超过阈值 - MapReduce服务 MRS

IoTDBServer进程RPC过高，会影响IoTDBServer进程数据读写性能下降。可能原因 IoTDBServer RPC有一个请求处理时长超过阈值，需要进一步分析日志查看。处理步骤收集故障信息。在FusionInsight Manager页面，选择“运维 > 告警 > 告警”，在实时告警

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-27006 数据目录磁盘空间使用率超过阈值 - MapReduce服务 MRS

业务数据写操作相关数据无法入库。可能原因告警阈值配置不合理。数据库数据量过大或磁盘配置无法满足业务需求，导致磁盘使用率达到上限。处理步骤检查阈值设置是否合理在FusionInsight Manager，选择“运维 > 告警 > 阈值设置 > 待操作集群的名称 > DBService

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-50212 FE进程的老年代GC耗时累计值超过阈值 - MapReduce服务 MRS

FE进程的垃圾回收时间过长，可能影响该FE进程正常提供服务。可能原因该FE节点实例堆内存使用率过大，或配置的堆内存不合理，导致进程GC频繁。处理步骤检查GC时间。在FusionInsight Manager首页，选择“运维 > 告警 > 告警”，查看“告警ID”为“50212”

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45279 RangerAdmin非堆内存使用率超过阈值 - MapReduce服务 MRS

非堆内存溢出可能导致服务崩溃。可能原因该节点RangerAdmin实例非堆内存使用率过大，或配置的非堆内存不合理，导致使用率超过阈值。处理步骤检查非堆内存使用率。在FusionInsight Manager首页，选择“运维 > 告警 > 告警 > ALM-45279 Ra

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45287 TagSync非堆内存使用率超过阈值 - MapReduce服务 MRS

对系统的影响非堆内存溢出可能导致服务崩溃。可能原因该节点TagSync实例非堆内存使用率过大，或配置的非堆内存不合理，导致使用率超过阈值。处理步骤检查非堆内存使用率。在FusionInsight Manager首页，选择“运维 > 告警 > 告警 > ALM-45287 Ta

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18000 Yarn服务不可用（2.x及以前版本） - MapReduce服务 MRS

x及以前版本）的处理步骤处理故障后，检查本告警是否恢复。是，处理完毕。否，执行2.b。检查HDFS服务状态。登录MRS集群详情页面，选择“告警管理”。在告警列表中，查看是否有HDFS相关告警产生。是，执行2.c。否，执行3.b。单击“告警管理”，根据告警帮助处理HDFS相关告警后，检查本告警是否恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14023 总副本预留磁盘空间所占比率超过阈值 - MapReduce服务 MRS

DataNode磁盘空间使用率超过阈值进行处理，查看对应告警是否清除。是，6。否，7。等待5分钟，检查该告警是否恢复。是，处理完毕。否，执行7。对DataNode进行扩容对DataNode进行扩容。等待5分钟，检查该告警是否恢复。是，处理完毕。否，执行9。收集故障信息

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-16001 Hive数据仓库空间使用率超过阈值 - MapReduce服务 MRS

否，执行9。分别参考ALM-12006 节点故障、ALM-12007 进程故障、ALM-14002 DataNode磁盘空间使用率超过阈值的处理步骤处理告警。查看本告警是否恢复。是，操作结束。否，执行9。收集故障信息。在FusionInsight Manager首页，选择“运维

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18012 JobHistoryServer进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ver进程正常提供服务。可能原因该节点JobHistoryServer实例堆内存使用率过大，或配置的堆内存不合理，导致进程GC频繁。处理步骤检查GC时间。在FusionInsight Manager首页，选择“运维 > 告警 > 告警 > ALM-18012 JobHi

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19008 HBase服务进程堆内存使用率超出阈值 - MapReduce服务 MRS

程中，该节点上的读写请求时延会变大或者失败。可能原因该节点HBase服务堆内存使用率过大，或配置的堆内存不合理，导致使用率超过阈值。处理步骤检查堆内存使用率在FusionInsight Manager首页，选择“运维 > 告警 > 告警”，选中“告警ID”为“19008

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19009 HBase服务进程直接内存使用率超出阈值 - MapReduce服务 MRS

HBase服务进程堆内存使用率超出阈值”告警。是，参考ALM-19008 HBase服务进程堆内存使用率超出阈值处理告警。否，执行8。观察界面告警是否清除。是，处理完毕。否，执行8。收集故障信息在FusionInsight Manager界面，选择“运维 > 日志 > 下载”。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 4084

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-45617 CDL复制槽Slot积压数据量超过阈值 - MapReduce服务 MRS

ALM-50217 FE节点堆内存的使用率超过阈值 - MapReduce服务 MRS

ALM-38013 Produce请求在请求队列的时延超过阈值 - MapReduce服务 MRS

ALM-43018 JobHistory2x进程Full GC次数超出阈值 - MapReduce服务 MRS

ALM-14006 HDFS文件数超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-18002 NodeManager心跳丢失（2.x及以前版本） - MapReduce服务 MRS

ALM-45329 Presto Coordinator资源组排队任务超过阈值 - MapReduce服务 MRS

ALM-45434 ClickHouse组件数据表中存在单副本 - MapReduce服务 MRS

ALM-45591 ConfigNode直接内存使用率超过阈值 - MapReduce服务 MRS

ALM-45592 IoTDBServer RPC执行时长超过阈值 - MapReduce服务 MRS

ALM-27006 数据目录磁盘空间使用率超过阈值 - MapReduce服务 MRS

ALM-50212 FE进程的老年代GC耗时累计值超过阈值 - MapReduce服务 MRS

ALM-45279 RangerAdmin非堆内存使用率超过阈值 - MapReduce服务 MRS

ALM-45287 TagSync非堆内存使用率超过阈值 - MapReduce服务 MRS

ALM-18000 Yarn服务不可用（2.x及以前版本） - MapReduce服务 MRS

ALM-14023 总副本预留磁盘空间所占比率超过阈值 - MapReduce服务 MRS

ALM-16001 Hive数据仓库空间使用率超过阈值 - MapReduce服务 MRS

ALM-18012 JobHistoryServer进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-19008 HBase服务进程堆内存使用率超出阈值 - MapReduce服务 MRS

ALM-19009 HBase服务进程直接内存使用率超出阈值 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线