检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
HBase组件不断上报服务不可用告警。 原因分析 该问题多半为HDFS性能较慢,导致健康检查超时,从而导致监控告警。可通过以下方式判断: 首先查看HMaster日志(“/var/log/Bigdata/hbase/hm/hbase-omm-xxx.log”),确认HMaster日志中没有频繁打印“system
访问Spark WebUI界面 操作场景 MRS集群安装Spark组件后,用户可以通过Spark WebUI界面查看Spark应用程序运行情况。 本章节指导用户在MRS集群中访问Spark WebUI界面。 前提条件 MRS集群已安装Spark组件,并且正常运行。 已创建具有Sp
/hbase/splitWAL查看该znode的容量使用情况,查看返回结果的“Data size”跟znode容量配额的比值是否接近告警的阈值。 是,执行5。 否,执行6。 在FusionInsight Manager首页,选择“运维 > 告警 > 告警”,查看是否存在“告警ID”为“
/hbase/splitWAL查看该znode的数量使用情况,查看返回结果的“Node count”跟znode数量配额的比值是否接近告警的阈值。 是,执行5。 否,执行6。 在FusionInsight Manager首页,选择“运维 > 告警 > 告警”,查看是否存在“告警ID”为“
进行排查。 查看作业管理中失败作业详情,找到作业详情中的实际作业编号。如果实际作业编号为空,则执行4。 登录Manager界面,选择“集群 > 服务 > Yarn > 概览 > ResourceManager Web UI”, 查找实际作业编号对应的Logs。 查看实际作业日志中
uide/): 查看帮助: help //查看hudi-cli的所有命令 help 'command' //查看某一个命令的帮助及参数列表。 连接表: connect --path '/tmp/huditest/test_table' 查看表信息: desc 查看compaction计划:
根据告警“定位信息”中的任务名找到失败任务,查找并记录失败作业的“application ID”,是否可以在Yarn页面上查看到作业日志。 图1 作业的“application ID” 是,执行4。 否,执行6。 单击失败作业application ID进入作业界面。 单击作业“Logs”列的“Logs”,查看jobmanager日志。
uide/): 查看帮助: help //查看hudi-cli的所有命令 help 'command' //查看某一个命令的帮助及参数列表。 连接表: connect --path '/tmp/huditest/test_table' 查看表信息: desc 查看compaction计划:
待操作集群的名称 > 服务”。 查看Kerberos服务的运行状态是否为“良好”。 是,执行5。 否,执行3。 参考ALM-25500 KrbServer服务不可用的相关维护信息进行操作。 查看告警是否清除。 是,处理完毕。 否,执行5。 检查ZooKeeper集群状态 查看ZooKeeper服务的运行状态是否为“良好”。
-exec ls -l {} \;,查看该节点上超过500MB的文件,查看该磁盘中,是否有误写入的大文件存在。 是,执行3.b。 否,执行4。 处理该误写入的文件,并等待2分钟,查看告警是否清除。 是,执行完毕。 否,执行4。 扩容磁盘。 等待2分钟,查看告警是否消失。 是,处理完毕。
同时具有当前应用查看权限。 应用查看权限 具有当前应用查看权限的用户,可以查看应用。 - 父主题: Flink用户权限管理
设置权限 Manager权限: Cluster: 查看权限:“集群”页面查看权限、“运维 > 告警”页面下“告警”、“事件”的查看权限。 管理权限:“集群”、“运维”页面的管理权限。 User: 查看权限:“系统”页面下“权限”区域中内容的查看权限。 管理权限:“系统”页面下“权限”区域中内容的管理权限。
登录FusionInsight Manager界面,查看右上角任务。 查看当前集群是否存在正在运行的任务。 是,等待任务运行结束。 否,检查结束。 检查是否有打开了第三方AD对接 登录FusionInsight Manager界面,单击“系统”页签。 选择“权限 > 第三方AD”,查看是否开启了第三方AD对接。
WebUI”后的链接,单击“作业管理”,在作业的“操作”列选择“更多 > 作业详情”也可查看taskmanager日志。 查看失败作业日志进行故障修复,或联系运维人员,并发送已收集的故障日志信息。操作结束。 若无法在Yarn页面上查看日志,可通过HDFS下载日志。 返回Manager,选择“集群 > 服务
@volatile private var endTime: Long = 0L @volatile private var numRecs: Long = 0L override def onQueryStarted(event: StreamingQueryListener
@volatile private var endTime: Long = 0L @volatile private var numRecs: Long = 0L override def onQueryStarted(event: StreamingQueryListener
计算实例进程故障 处理步骤 检查HDFS服务状态。 在告警列表中,查看是否有“ALM-14000 HDFS服务不可用”告警产生。 是,执行2。 否,执行4。 参考ALM-14000 HDFS服务不可用告警帮助指导处理该告警。 在告警列表中,查看“ALM-45001 HetuEngine计算实例故障”告警是否清除。
WebUI”后的链接,单击“作业管理”,在作业的“操作”列选择“更多 > 作业详情”也可查看taskmanager日志。 查看失败作业日志进行故障修复,或联系运维人员,并发送已收集的故障日志信息。操作结束。 若无法在Yarn页面上查看日志,可通过HDFS下载日志。 返回Manager,选择“集群 > 服务
MRS集群运维 MRS集群运维说明 登录MRS集群 查看MRS集群监控指标 MRS集群健康检查 MRS集群容量调整 备份恢复MRS集群数据 安装MRS集群补丁 MRS集群补丁说明 查看MRS集群日志 MRS集群安全配置 查看与配置MRS告警事件 MRS集群告警处理参考 配置MRS集群远程运维
重启该实例。 等待5分钟,查看告警是否自动清除。 是,操作结束。 否,执行5。 检查是否慢盘故障。 在FusionInsight Manager界面,选择“运维 > 告警 > 告警”,查看此告警的详细信息,记录定位信息中上报告警的“主机名”名称。 查看5上报告警的节点是否存在“慢盘故障”或“磁盘不可用”告警。