检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
HBase恢复任务执行失败后系统自动回滚数据,如果页面详情中提示“Rollback recovery failed”信息,表示回滚失败。由于回滚失败后就不会处理数据,所以有可能产生垃圾数据,需要如何解决? 回答 在下次执行备份或恢复任务前,需要手动清除这些垃圾数据。 安装集群客户端,例如安装目录为“/opt/client”。
如何修改FlumeClient的日志为标准输出日志? 登录Flume客户端安装节点。 进入Flume客户端安装目录,假设Flume客户端安装路径为“/opt/FlumeClient”,可以执行以下命令。 cd /opt/FlumeClient/fusioninsight-flume-1
Spark应用开发简介 Spark简介 Spark是分布式批处理框架,提供分析挖掘与迭代式内存计算能力,支持多种语言(Scala/Java/Python)的应用开发。 适用以下场景: 数据处理(Data Processing):可以用来快速处理数据,兼具容错性和可扩展性。 迭代计算(Iterative
Spark应用开发简介 Spark简介 Spark是分布式批处理框架,提供分析挖掘与迭代式内存计算能力,支持多种语言(Scala/Java/Python)的应用开发。 适用以下场景: 数据处理(Data Processing):可以用来快速处理数据,兼具容错性和可扩展性。 迭代计算(Iterative
行权限。如果这些文件产生在该告警的监控范围内,那么系统会上报该告警,告警原因可以看到是由于产生的临时文件权限异常导致,可以参照上述告警处理流程处理该告警,或者确认权限异常文件为临时文件后,可以直接删除。sed命令产生的临时文件类似于下图。 收集故障信息。 在FusionInsight
询等)失败,如果有多个节点互信失效可能会影响业务。 可能原因 /etc/ssh/sshd_config配置文件被破坏。 omm密码过期。 处理步骤 查看/etc/ssh/sshd_config配置文件状态。 打开FusionInsight Manager页面,在告警列表中,单击此
产生告警的主机名。 对系统的影响 omm用户过期,Manager各节点互信不可用,无法对服务提供管理功能。 可能原因 该主机omm用户即将过期。 处理步骤 检查系统中omm用户是否即将过期。 以root用户登录集群故障节点,用户密码为安装前用户自定义,请咨询系统管理员。 执行chage -l
omm密码过期,Manager各节点互信不可用,无法对服务提供管理功能,crontab计划任务无法执行,影响ClickHouse业务。 可能原因 该主机omm密码即将过期。 处理步骤 检查系统中omm密码是否即将过期。 以root用户登录集群故障节点,用户密码为安装前用户自定义,请咨询系统管理员。 执行chage -l
系统当前指标取值满足自定义的告警设置条件。 对系统的影响 HDFS文件数过多可能造成HDFS系统响应慢或磁盘被占满。 可能原因 HDFS文件数超过阈值。 处理步骤 检查系统中的文件数量。 在FusionInsight Manager首页,查看当前的HDFS文件数。HDFS文件数可以通单击“集群 >
如果无法查询出健康状态码或者浏览器一直无响应,可能是由于Oozie进程故障导致服务不可用,请参考13进行处理。 根据查询到的错误码执行相关处理步骤,请参考表1。 表1 Oozie服务健康状态码一览表 状态码 错误描述 错误原因 处理步骤 0 服务正常 无 无 18002 DBService服务异常 Oozi
除。 是,处理完毕。 否,执行4。 手动清除此告警,后续删除主机前务必进行退服操作。 在FusionInsight Manager界面,选择“集群 > 主机”,查看1中获取的节点是否健康。 是,执行7。 否,执行6。 参考ALM-12006 节点故障的操作步骤进行处理,节点恢复正常后,查看本告警是否恢复。
角色名 产生告警的角色名称。 主机名 产生告警的主机名。 对系统的影响 用户无法使用Kudu服务。 可能原因 Kudu有实例存在异常。 处理步骤 处理Kudu实例异常 在FusionInsight Manager首页,选择“运维 > 告警 > 告警”页面,找到“ALM-29100 Kudu服务异常”告警。
对系统的影响 ClickHouse中表存在数据倾斜,可能导致sql执行效率低。 可能原因 数据写入策略不合理,导致各节点之间数据不均衡。 处理步骤 登录FusionInsight Manager页面,选择“运维 > 告警 > 告警”,查看当前告警“定位信息”中的角色名以及确认主机名所在的IP地址。
usionInsight Manager系统的监控指标。 可能原因 无法连接服务器。 无法访问服务器上保存路径。 上传监控指标文件失败。 处理步骤 查看服务器连接是否正常。 查看FusionInsight Manager系统与服务器网络连接是否正常。 是,执行3。 否,执行2。
Manager平台,无法进行正常运维操作。 controller进程持续重启,可能引起无法访问服务原生UI界面。 可能原因 controller进程异常。 处理步骤 检查controller进程是否异常。 打开FusionInsight Manager页面,在告警列表中,单击此告警所在行的,查看该告警的主机名称。
Manager平台,无法进行正常运维操作。 floatip进程持续重启,可能引起无法访问服务原生UI界面。 可能原因 浮动IP地址异常。 处理步骤 检查主管理节点的浮动IP地址状态。 打开FusionInsight Manager页面,在告警列表中,单击此告警所在行的,查看该告警的主机地址及资源名称。
产生告警的主机名。 对系统的影响 ommdba密码过期,OMS数据库无法管理,数据不能访问。 可能原因 该主机ommdba密码即将过期。 处理步骤 检查系统中ommdba密码是否即将过期。 以root用户登录集群故障节点,用户密码为安装前用户自定义,请咨询系统管理员。 执行chage
等待5分钟后,在Manager页面选择“运维 > 告警 > 告警”页签,查看该告警是否清除。 是,处理完毕。 否,请联系运维人员进行处理。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 不涉及。 父主题: MRS集群告警处理参考
状态和Z状态。或进程可能被挂起进入T状态。 处理步骤 查看进程是否处于D、Z、T状态 登录FusionInsight Manager页面,选择“运维 > 告警 > 告警”,等待约10分钟后,在告警列表中查看该告警是否自动清除。 是,处理完毕。 否,查看该告警详细信息,记录上报告警的主机IP地址。执行2。
在“进程故障”,查看“服务名”是否为“ZooKeeper”。 是,执行6。 否,执行8。 参考ALM-12007 进程故障的处理步骤处理该故障。 在告警列表中,查看“Hive服务不可用”告警是否清除。 是,处理完毕。 否,执行8。 检查HDFS服务状态。 在FusionInsight Manager的告警列