搜索_华为云

ALM-50212 FE进程的老年代GC耗时累计值超过阈值 - MapReduce服务 MRS

FE进程的垃圾回收时间过长，可能影响该FE进程正常提供服务。可能原因该FE节点实例堆内存使用率过大，或配置的堆内存不合理，导致进程GC频繁。处理步骤检查GC时间。在FusionInsight Manager首页，选择“运维 > 告警 > 告警”，查看“告警ID”为“50212”

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-50217 FE节点堆内存的使用率超过阈值 - MapReduce服务 MRS

Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响影响任务执行和客户端连接FE。可能原因 FE堆内存过小。处理步骤检查堆内存使用率。登录FusionInsight Manager，选择“运维 > 告警 > 阈值设置 > 待操作集群的名称 > Doris

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14006 HDFS文件数超过阈值（2.x及以前版本） - MapReduce服务 MRS

File”监控项查看。等待5分钟后，检查本告警是否清除。是，处理完毕。否，执行3。收集故障信息。在MRS Manager界面，单击“系统设置 > 日志导出”。请联系运维人员，并发送已收集的故障日志信息。参考信息无。父主题： MRS集群告警处理参考

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18000 Yarn服务不可用（2.x及以前版本） - MapReduce服务 MRS

x及以前版本）的处理步骤处理故障后，检查本告警是否恢复。是，处理完毕。否，执行2.b。检查HDFS服务状态。登录MRS集群详情页面，选择“告警管理”。在告警列表中，查看是否有HDFS相关告警产生。是，执行2.c。否，执行3.b。单击“告警管理”，根据告警帮助处理HDFS相关告警后，检查本告警是否恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18002 NodeManager心跳丢失（2.x及以前版本） - MapReduce服务 MRS

NodeManager和ResourceManager之间的网络断连或者繁忙。处理步骤收集故障信息。在MRS Manager界面，单击“系统设置 > 日志导出”。请联系运维人员，并发送已收集的故障日志信息。参考信息无。父主题： MRS集群告警处理参考

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-26051 Storm服务不可用（2.x及以前版本） - MapReduce服务 MRS

否，执行4。等待30秒，查看告警是否恢复。是，处理完毕。否，执行4。收集故障信息。在MRS Manager界面，单击“系统设置 > 日志导出”。请联系运维人员，并发送已收集的故障日志信息。参考信息无。父主题： MRS集群告警处理参考

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18008 ResourceManager堆内存使用率超过阈值 - MapReduce服务 MRS

n服务不可用。可能原因该节点Yarn ResourceManager实例堆内存使用量过大，或分配的堆内存不合理，导致使用量超过阈值。处理步骤检查堆内存使用量。在FusionInsight Manager界面，选择“运维 > 告警 > 告警 > Yarn ResourceManager堆内存使用率超过阈值

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18010 ResourceManager进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ager进程正常提供服务。可能原因该节点ResourceManager实例堆内存使用率过大，或配置的堆内存不合理，导致进程GC频繁。处理步骤检查GC时间。在FusionInsight Manager首页，选择“运维 > 告警 > 告警 > ALM-18010 Resou

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19031 RegionServer的RPC连接数超过阈值 - MapReduce服务 MRS

等待几分钟后，在告警列表中查看该告警是否清除。是，处理完毕。否，执行5。排查访问HBase服务的应用的并发数，确认并发数是否过大。是，执行6。否，执行8。应用根据实际业务适当调小并发数。等待几分钟后，在告警列表中查看该告警是否清除。是，处理完毕。否，执行8。收集故障信息在FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-27006 数据目录磁盘空间使用率超过阈值 - MapReduce服务 MRS

业务数据写操作相关数据无法入库。可能原因告警阈值配置不合理。数据库数据量过大或磁盘配置无法满足业务需求，导致磁盘使用率达到上限。处理步骤检查阈值设置是否合理在FusionInsight Manager，选择“运维 > 告警 > 阈值设置 > 待操作集群的名称 > DBService

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
创建FlinkServer作业写入数据至HBase表 - MapReduce服务 MRS

UI。参考如何创建FlinkServer作业，新建Flink SQL作业，作业类型选择“流作业”。在作业开发界面进行如下作业配置并启动作业。需勾选“基础参数”中的“开启CheckPoint”，“时间间隔（ms）”可设置为“60000”，“模式”可使用默认值。安全集群且HBase的认证模式为hbase

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
PMS进程占用内存高 - MapReduce服务 MRS

PMS进程占用内存高用户问题主Master节点内存使用率高如何处理？问题现象主Master节点内存使用率高，且用top -c命令查询的内存占用量高的是如下idle的进程。原因分析 PostgreSQL缓存：除了常见的执行计划缓存、数据缓存，PostgreSQL为了提高生

 帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
ALM-43009 JobHistory2x进程GC时间超出阈值 - MapReduce服务 MRS

查询Spark任务历史执行记录。可能原因该节点JobHistory2x进程堆内存使用率过大，或配置的堆内存不合理，导致进程GC频繁。处理步骤检查GC时间在FusionInsight Manager首页，选择“运维 > 告警 > 告警”，选中“ID”为“43009”的告警

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12034 周期备份任务失败（2.x及以前版本） - MapReduce服务 MRS

周期备份任务失败，可能会导致长时间没有可用的备份包，在系统出现异常时，无法恢复。可能原因该告警产生原因依赖于该任务的详细情况，直接获取日志和任务详情来处理该告警。处理步骤查看磁盘空间是否不足在MRS Manager界面，单击“告警管理”。在告警列表中单击该告警的，从“定位信息”处获得“任务名”。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12038 监控指标转储失败（2.x及以前版本） - MapReduce服务 MRS

监控指标转储失败会影响上层管理系统无法获取到MRS Manager系统的监控指标。可能原因无法连接服务器。无法访问服务器上保存路径。上传监控指标文件失败。处理步骤联系运维人员查看MRS Manager系统与服务器网络连接是否正常。是，执行3。否，执行2。联系运维人员恢复网络连接，然后检查告警是否恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19006 HBase容灾同步失败（2.x及以前版本） - MapReduce服务 MRS

HBase服务不可用”告警产生。是，执行2.i。否，执行3.a。参考ALM-19000 HBase服务不可用（2.x及以前版本）的处理步骤处理该故障。等待几分钟后检查本告警是否恢复。是，处理完毕。否，执行3.a。检查主备集群RegionServer之间的网络连接。登录MRS集群详情页面，选择“告警管理”。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45005 HetuEngine计算实例CPU负载使用率超过阈值 - MapReduce服务 MRS

可能原因计算实例资源配置过小。业务存在大SQL任务，占用过多计算资源，导致其他提交的任务无资源可用，整个计算实例响应变慢，造成任务积压。处理步骤检查计算实例资源配置是否合理使用可访问HetuEngine WebUI界面的管理员用户登录FusionInsight Manager。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45176 OBS元数据接口调用成功率低于阈值 - MapReduce服务 MRS

OBS元数据接口调用成功率小于阈值，会影响上层大数据计算业务的正常执行，导致某些计算任务的执行失败。可能原因 OBS服务端出现执行异常或严重超时。处理步骤检查堆内存使用率。在FusionInsight Manager首页，选择“运维 > 告警 > 告警 > OBS元数据接口调用成功率

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45284 UserSync垃圾回收(GC)时间超过阈值 - MapReduce服务 MRS

对系统的影响导致UserSync响应缓慢。可能原因该节点UserSync实例堆内存使用率过大，或配置的堆内存不合理，导致进程GC频繁。处理步骤检查GC时间。在FusionInsight Manager首页，选择“运维 > 告警 > 告警 > ALM-45284 UserS

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45291 PolicySync非堆内存使用率超过阈值 - MapReduce服务 MRS

非堆内存溢出可能导致服务崩溃。可能原因该节点PolicySync实例非堆内存使用率过大，或配置的非堆内存不合理，导致使用率超过阈值。处理步骤检查非堆内存使用率。在FusionInsight Manager首页，选择“运维 > 告警 > 告警 > ALM-45291 Po

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 4084

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-50212 FE进程的老年代GC耗时累计值超过阈值 - MapReduce服务 MRS

ALM-50217 FE节点堆内存的使用率超过阈值 - MapReduce服务 MRS

ALM-14006 HDFS文件数超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-18000 Yarn服务不可用（2.x及以前版本） - MapReduce服务 MRS

ALM-18002 NodeManager心跳丢失（2.x及以前版本） - MapReduce服务 MRS

ALM-26051 Storm服务不可用（2.x及以前版本） - MapReduce服务 MRS

ALM-18008 ResourceManager堆内存使用率超过阈值 - MapReduce服务 MRS

ALM-18010 ResourceManager进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-19031 RegionServer的RPC连接数超过阈值 - MapReduce服务 MRS

ALM-27006 数据目录磁盘空间使用率超过阈值 - MapReduce服务 MRS

创建FlinkServer作业写入数据至HBase表 - MapReduce服务 MRS

PMS进程占用内存高 - MapReduce服务 MRS

ALM-43009 JobHistory2x进程GC时间超出阈值 - MapReduce服务 MRS

ALM-12034 周期备份任务失败（2.x及以前版本） - MapReduce服务 MRS

ALM-12038 监控指标转储失败（2.x及以前版本） - MapReduce服务 MRS

ALM-19006 HBase容灾同步失败（2.x及以前版本） - MapReduce服务 MRS

ALM-45005 HetuEngine计算实例CPU负载使用率超过阈值 - MapReduce服务 MRS

ALM-45176 OBS元数据接口调用成功率低于阈值 - MapReduce服务 MRS

ALM-45284 UserSync垃圾回收(GC)时间超过阈值 - MapReduce服务 MRS

ALM-45291 PolicySync非堆内存使用率超过阈值 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线