搜索_华为云

快速使用Flume采集节点日志 - MapReduce服务 MRS

servers：Kafkabrokers列表，多个用英文逗号分隔。默认情况下，安全集群端口21007，普通集群对应端口9092。 client.sinks.kafka_sink.kafka.security.protocol：安全集群为SASL_PLAINTEXT，普通集群为PLAINTEXT。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume
MRS 2.1.0.5补丁说明 - MapReduce服务 MRS

executor进程会内存溢出支持提交作业，manager executor可配置并发度功能 MRS manager管理面看不到Kafka新建的topic 安全集群API方式提交Spark Submit作业操作HBase表，HBase表权限控制未生效 MRS manager补丁机制优化 MRS大数据组件

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明
ALM-50221 BE数据盘的使用率超过阈值 - MapReduce服务 MRS

系统当前指标取值满足自定义的告警设置条件。对系统的影响新数据写入失败，任务中断。可能原因集群磁盘容量已满。 BE节点间数据倾斜。处理步骤登录FusionInsight Manager页面，选择“运维 > 告警 > 告警”，查看当前告警“定位信息”中的角色名并确认主机名所在的IP地址。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45182 OBS操作被流控次数高于阈值 - MapReduce服务 MRS

可能原因请求OBS接口频率太高。处理步骤登录FusionInsight Manager，选择“运维 > 告警 > 阈值设置 > meta > OBS操作被流控总数”，将阈值或平滑次数参数的值根据实际情况调大。观察界面告警是否清除。是，处理完毕。否，执行3。联系OBS运维人员查看OBS服务是否正常。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45431 ClickHouse 实例不满足拓扑分配 - MapReduce服务 MRS

安装或扩容过程中，实例数或分配方式不能满足拓扑要求。处理步骤在FusionInsight Manager首页，选择“运维 > 告警 > 告警”，找到本告警，根据告警中的“定位信息”和“附加信息”分析告警原因。参考下表，根据告警附加信息说明和处理方式进行处理。告警附加信息说明处理方式 n ClickHouseServer

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45438 ClickHouse磁盘使用率超过80% - MapReduce服务 MRS

产生告警的磁盘路径对系统的影响磁盘使用率高可能导致ClickHouse写入执行失败。可能原因 ClickHouseServer节点磁盘容量过小。处理步骤登录FusionInsight Manager页面，选择“运维 > 告警 > 告警”，查看当前告警“定位信息”中的角色名以及确认主机名所在的IP地址。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-25000 LdapServer服务不可用 - MapReduce服务 MRS

查看告警信息里的主机名是否和1主机名一致。是，执行4。否，执行6。按“ALM-12006 节点故障”提供的步骤处理该告警。在告警列表中查看“LdapServer服务不可用”告警是否清除。是，处理完毕。否，执行10。检查LdapServer进程是否正常。选择“运维 > 告警 > 告警”

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-27004 DBService主备数据不同步 - MapReduce服务 MRS

主备节点网络不稳定。备DBService异常。备节点磁盘空间满。主DBService节点GaussDB进程CPU使用率高（需要通过日志定位该问题）。处理步骤检查主备节点网络是否正常。在FusionInsight Manager页面，选择“集群 > 服务 > DBService > 实例

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-29012 Impalad 正在等待的查询总数超过阈值 - MapReduce服务 MRS

系统当前指标取值满足自定义的告警设置条件对系统的影响查询可能会阻塞甚至失败。可能原因该Impalad服务维护的查询数量过多，或者阈值设定的太小。处理步骤在FusionInsight Manager首页，选择“运维 > 告警 > 阈值设置 > Impala > 查询任务总数统计 > 等待中的查询总数”，检查阈值大小。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-29015 Catalog进程内存占用率超过阈值 - MapReduce服务 MRS

系统当前指标取值满足自定义的告警设置条件。对系统的影响内存使用过高，部分查询任务可能因为内存不足而失败。可能原因该节点实例内存使用率过大，或配置的内存不合理。处理步骤在FusionInsight Manager首页，选择“运维 > 告警 > 阈值设置 > Impala > CPU和内存 > Cat

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45637 FlinkServer作业task持续背压 - MapReduce服务 MRS

业级别的告警，对FlinkServer本身没有影响。可能原因 FlinkServer作业Task持续背压的具体原因可在具体日志中查看。处理步骤使用具有FlinkServer管理操作权限的用户登录Manager。选择“集群 > 服务 > Yarn”，单击“ResourceManager

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45645 RocksDB的Pending Flush持续超过阈值 - MapReduce服务 MRS

推荐2-10 否：执行9。重启作业，检查告警是否恢复。是，处理完毕。否，执行9。联系运维人员，并发送已收集的故障日志信息。告警清除此告警修复后，系统会自动清除此告警，无需手工清除。参考信息不涉及。父主题： MRS集群告警处理参考

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-43001 Spark2x服务不可用 - MapReduce服务 MRS

ALM-16004 Hive服务不可用是，执行3。否，执行4。根据对应服务不可用告警帮助提供的故障处理对应告警。告警全部恢复后，等待几分钟，检查本告警是否恢复。是，处理完毕。否，执行4。检查NameNode节点内存是否不足。检查NameNode节点内存，查看是否有节点存在内存不足的问题。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12035 恢复任务失败后数据状态未知 - MapReduce服务 MRS

该告警产生原因可能是执行恢复任务前组件状态不满足要求或执行恢复任务中某个步骤出错，执行恢复任务中出错依赖于该任务的详细情况，可以获取日志和任务详情来处理该告警。处理步骤查看组件状态在FusionInsight Manager管理界面，选择“集群 > 待操作集群的名称 > 服务”，查看组件当前

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12045 网络读包丢包率超过阈值 - MapReduce服务 MRS

图1 设置告警阈值等待5分钟，检查该告警是否恢复。是，处理完毕。否，执行8。检查网络是否异常。联系网络管理员，检查网络是否存在异常。是，恢复网络故障，执行9。否，执行10。等待5分钟，检查该告警是否恢复。是，处理完毕。否，执行10。收集故障信息。在主集群的FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12046 网络写包丢包率超过阈值 - MapReduce服务 MRS

图1 设置告警阈值等待5分钟，检查该告警是否恢复。是，处理完毕。否，执行4。检查网络是否异常。联系网络管理员，检查网络是否存在异常。是，恢复网络故障，执行5。否，执行6。等待5分钟，检查该告警是否恢复。是，处理完毕。否，执行6。收集故障信息。在主集群的FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12102 AZ高可用组件未按容灾需求部署 - MapReduce服务 MRS

实例”，在实例页面，重新部署或调整该角色实例。等待10分钟，检查该告警是否恢复。是，处理完毕。否，请联系运维人员。告警清除此告警修复后，系统会自动清除此告警，无需手工清除。参考信息无。父主题： MRS集群告警处理参考

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14011 DataNode数据目录配置不合理 - MapReduce服务 MRS

DataNode数据目录创建失败。 DataNode数据目录与系统关键目录（“/”或“/boot”）使用同一磁盘。 DataNode数据目录中多个目录使用同一磁盘。处理步骤查看告警原因和产生告警的DataNode节点信息。在FusionInsight Manager首页，选择“运维 > 告警 > 告警”，在告警列表中单击此告警。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14013 NameNode FsImage文件更新失败 - MapReduce服务 MRS

主NameNode的业务IP:/tmp 是，执行24。否，执行23。联系MRS集群管理员，处理在omm用户下备NameNode无法推送数据到主NameNode的原因。故障恢复后等待1个NameNode合并元数据的周期时间，查看告警是否清除。是，处理完毕。否，执行24。查看主NameNode数据目录空间是否不足。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-17004 Oozie堆内存使用率超过阈值 - MapReduce服务 MRS

堆内存溢出可能导致服务崩溃，服务崩溃后无法使用Oozie服务调度任务。可能原因该节点Oozie实例堆内存使用率过大，或配置的堆内存不合理，导致使用率超过阈值。处理步骤检查堆内存使用率。在FusionInsight Manager首页，选择“运维 > 告警 > 告警 > Oozie堆内存使用率超过

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 4093

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

快速使用Flume采集节点日志 - MapReduce服务 MRS

MRS 2.1.0.5补丁说明 - MapReduce服务 MRS

ALM-50221 BE数据盘的使用率超过阈值 - MapReduce服务 MRS

ALM-45182 OBS操作被流控次数高于阈值 - MapReduce服务 MRS

ALM-45431 ClickHouse 实例不满足拓扑分配 - MapReduce服务 MRS

ALM-45438 ClickHouse磁盘使用率超过80% - MapReduce服务 MRS

ALM-25000 LdapServer服务不可用 - MapReduce服务 MRS

ALM-27004 DBService主备数据不同步 - MapReduce服务 MRS

ALM-29012 Impalad 正在等待的查询总数超过阈值 - MapReduce服务 MRS

ALM-29015 Catalog进程内存占用率超过阈值 - MapReduce服务 MRS

ALM-45637 FlinkServer作业task持续背压 - MapReduce服务 MRS

ALM-45645 RocksDB的Pending Flush持续超过阈值 - MapReduce服务 MRS

ALM-43001 Spark2x服务不可用 - MapReduce服务 MRS

ALM-12035 恢复任务失败后数据状态未知 - MapReduce服务 MRS

ALM-12045 网络读包丢包率超过阈值 - MapReduce服务 MRS

ALM-12046 网络写包丢包率超过阈值 - MapReduce服务 MRS

ALM-12102 AZ高可用组件未按容灾需求部署 - MapReduce服务 MRS

ALM-14011 DataNode数据目录配置不合理 - MapReduce服务 MRS

ALM-14013 NameNode FsImage文件更新失败 - MapReduce服务 MRS

ALM-17004 Oozie堆内存使用率超过阈值 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线