搜索_华为云

ALM-16052 MetaStore创建表时访问元数据库时延超过阈值 - MapReduce服务 MRS

理步骤处理该故障。在告警列表中，查看该告警是否清除。是，处理完毕。否，执行4。查看元数据库是否异常。联系集群元数据库管理员查看元数据库是否有异常。是，执行5。否，执行6。联系元数据库运维人员修复。元数据恢复正常后在告警列表中查看该告警是否清除。是，处理完毕。否，执行6。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
回滚补丁前检查 - MapReduce服务 MRS

登录FusionInsight Manager界面，查看右上角任务。查看当前集群是否存在正在运行的任务。是，等待任务运行结束。否，检查结束。检查是否有打开了第三方AD对接登录FusionInsight Manager界面，单击“系统”页签。选择“权限 > 第三方AD”，查看是否开启了第三方AD对接。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.2.0-LTS.1.9补丁说明 > 回滚补丁
回滚补丁前检查 - MapReduce服务 MRS

登录FusionInsight Manager界面，查看右上角任务。查看当前集群是否存在正在运行的任务。是，等待任务运行结束。否，检查结束。检查是否有打开了第三方AD对接登录FusionInsight Manager界面，单击“系统”页签。选择“权限 > 第三方AD”，查看是否开启了第三方AD对接。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.2.0-LTS.1.10补丁说明 > 回滚补丁
ALM-12081 ommdba用户过期 - MapReduce服务 MRS

系统管理员。执行chage -l ommdba命令查看当前ommdba用户密码设置信息。查找“Account expires”对应值，查看用户设置是否过期。如果参数值为“never”，则代表永不过期；如果为日期值，则查看是否过期。是，执行3。否，执行4。执行chage

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
配置积压告警规则 - MapReduce服务 MRS

其中消息积压的计算规则为当前Topic中所有分区的消息积压（Lag）的总和，可以参考使用KafkaUI查看当前消费情况，查看消费者组中Topic所有分区的消息积压情况，如下图所示：创建完成后，可以在“Lag Alarms”界面查看、修改、删除Kafka消息积压告警的规则信息。父主题： Kafka运维管理

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka运维管理
回滚补丁前检查 - MapReduce服务 MRS

告警”。查看当前集群是否存在“ALM-12089 节点间网络互通异常”、“节点故障”告警。是，节点间网络不互通，请联系运维人员修复。否，节点间网络互通，检查结束。检查弹性伸缩是否关闭登录华为云管理控制台，在“现有集群”列表中选择对应集群，单击“弹性伸缩”。查看当前集群的弹性伸缩策略是否是关闭状态。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.1.0 运维通道补丁说明 > 回滚补丁
ALM-17008 Oozie连接ZooKeeper状态异常 - MapReduce服务 MRS

检查ZooKeeper服务状态。在FusionInsight Manager的服务列表中，查看ZooKeeper运行状态是否为“良好”。是，执行5。否，执行2。在告警列表中，查看是否有“ALM-13000 ZooKeeper服务不可用”告警产生。是，执行3。否，执行5。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-17010 Oozie连接HDFS状态异常 - MapReduce服务 MRS

Manager的服务列表中，查看HDFS运行状态是否为“良好”。是，执行5。否，执行2。在告警列表中，查看是否有“ALM-14000 HDFS服务不可用”告警产生。是，执行3。否，执行5。参考ALM-14000 HDFS服务不可用的处理步骤处理该故障。等待几分钟后，在告警列表中查看“Oo

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Flume运维管理 - MapReduce服务 MRS
Flume运维管理 - MapReduce服务 MRS

Flume运维管理 Flume常用配置参数 Flume日志介绍查看Flume客户端日志查看Flume客户端监控信息停止或卸载Flume客户端父主题：使用Flume

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume
Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

@volatile private var endTime: Long = 0L @volatile private var numRecs: Long = 0L override def onQueryStarted(event: StreamingQueryListener

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序
Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

@volatile private var endTime: Long = 0L @volatile private var numRecs: Long = 0L override def onQueryStarted(event: StreamingQueryListener

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序
ALM-38018 Kafka消息积压 - MapReduce服务 MRS

检查是否为新创建的消费者组。在FusionInsight Manager首页，选择“运维 > 告警 > 告警”。查看当前告警详细信息，在定位信息中查看告警上报的Kafka消费者组名称，在附加信息中查看Topic名称。根据实际情况判断消费者组是否为新创建。是，执行3。新创建的消费者组，新消费

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19019 HBase容灾等待同步的HFile文件数量超过阈值 - MapReduce服务 MRS

处理步骤查看告警定位信息在FusionInsight Manager首页，选择“运维 > 告警 > 告警”，选择“告警ID”为“19019”的告警，查看“定位信息”中产生该告警的服务实例和主机名。检查主备集群RegionServer之间的网络连接。执行ping命令，查看故障R

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

续超过阈值”，检查该告警的“定位信息”，查看并记录告警上报的任务名。选择“集群 > 服务 > Yarn”，单击“ResourceManager WebUI”后的链接进入Yarn原生页面。根据告警“定位信息”中的任务名找到异常任务，查找并记录作业的“application ID

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19035 RegionServer Call队列大小超过阈值 - MapReduce服务 MRS

Manager首页，选择“运维 > 告警 > 告警”，查看“告警ID”为“19035”的告警的“定位信息”中上报该告警的服务实例和主机名。检查RegionServer堆内存配置。在FusionInsight Manager的告警列表中，查看1中的告警实例是否有“HBase服务进程堆内存使用率超过阈值”告警产生。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45650 RocksDB的Write P95耗时持续超过阈值 - MapReduce服务 MRS

WebUI”后的链接，单击“作业管理”，在作业的“操作”列选择“更多 > 作业详情”也可查看Taskmanager日志。查看作业日志进行故障修复，或联系运维人员，并发送已收集的故障日志信息。操作结束。若无法在Yarn页面上查看日志，可通过HDFS下载日志。返回Manager，选择“集群 > 服务

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14011 HDFS DataNode数据目录配置不合理（2.x及以前版本） - MapReduce服务 MRS

root su - omm 使用ls命令查看DataNode数据目录中的每个目录是否存在。是，执行7。否，执行3.c。使用mkdir 数据目录命令创建该目录，查看是否可以创建成功。是，执行6.a。否，执行3.d。单击“告警管理”，查看是否存在告警“ALM-12017 磁盘容量不足”。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18024 Yarn任务挂起内存量超阈值 - MapReduce服务 MRS

ication Queues”中查看root队列是否资源用满。是，执行3。否，执行4。对Yarn服务的NodeManager实例进行扩容。扩容后，查看告警是否消除。是，处理完毕。否，执行6。检查队列最大资源容量和AM最大资源百分比查看pending任务对应的队列的资源是否用满。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
导入并配置HBase样例工程 - MapReduce服务 MRS

确保本地PC的时间与MRS集群的时间差要小于5分钟，若无法确定，请联系系统管理员。MRS集群的时间可通过FusionInsight Manager页面右下角查看。操作步骤参考获取MRS应用开发样例工程，获取样例代码解压目录中“src/hbase-examples”目录下的样例工程文件夹“hbase-example”。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > 准备HBase应用开发环境
【Spark WebUI】HistoryServer缓存的应用被回收导致此类应用页面访问时出错 - MapReduce服务 MRS

”文件。当用户正在查看即将被回收的Spark应用时，可能会出现找不到“temp_shuffle”文件的错误，从而导致当前页面无法访问。处理步骤如果遇到上述问题，可参考以下两种方法解决。重新访问这个Spark应用的HistoryServer页面，即可查看到正确的页面信息。

帮助中心 > MapReduce服务 MRS > 故障排除 > Web页面访问类 > 访问MRS组件Web UI界面常见异常问题

总条数： 4340

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-16052 MetaStore创建表时访问元数据库时延超过阈值 - MapReduce服务 MRS

回滚补丁前检查 - MapReduce服务 MRS

回滚补丁前检查 - MapReduce服务 MRS

ALM-12081 ommdba用户过期 - MapReduce服务 MRS

配置积压告警规则 - MapReduce服务 MRS

回滚补丁前检查 - MapReduce服务 MRS

ALM-17008 Oozie连接ZooKeeper状态异常 - MapReduce服务 MRS

ALM-17010 Oozie连接HDFS状态异常 - MapReduce服务 MRS

Flume运维管理 - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

ALM-38018 Kafka消息积压 - MapReduce服务 MRS

ALM-19019 HBase容灾等待同步的HFile文件数量超过阈值 - MapReduce服务 MRS

ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

ALM-19035 RegionServer Call队列大小超过阈值 - MapReduce服务 MRS

ALM-45650 RocksDB的Write P95耗时持续超过阈值 - MapReduce服务 MRS

ALM-14011 HDFS DataNode数据目录配置不合理（2.x及以前版本） - MapReduce服务 MRS

ALM-18024 Yarn任务挂起内存量超阈值 - MapReduce服务 MRS

导入并配置HBase样例工程 - MapReduce服务 MRS

【Spark WebUI】HistoryServer缓存的应用被回收导致此类应用页面访问时出错 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线