检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
SEQ”等关于数据库信息。 回答 该现象可能出现在安装两个RangerAmdin实例的场景下。 启动失败后,请先手动重启一个RangerAdmin,然后再逐步重启其他实例。 父主题: Ranger常见问题
进程被终止如何定位原因 问题背景与现象 在某环境出现DataNode异常重启,且确认此时未从页面做重启DataNode的操作,需要定位是什么进程终止了DataNode服务端进程。 原因分析 常见的进程被异常终止有2种原因: Java进程OOM被终止 一般Java进程都会配置OOM
DBServer启动失败 问题背景与现象 DBService组件启动失败,重启还是失败,实例状态一直为正在恢复状态。 图1 DBService 的状态 原因分析 查看DBService的日志/var/log/Bigdata/dbservice/DB/gs_ctl-current.log,报如下错误。
/opt/Bigdata/om-0.0.1/sbin/restart-controller.sh重启Controller。 请在Manager页面没有其他操作后重启Controller,重启Controller对大数据组件业务无影响。 重新执行1~7同步ResourceManager的配置并检查配置是否正常。
)功能,防止单节点故障以及多节点同时处理一个任务。 本章节内容仅适用于MRS 3.1.2及之后版本。 对系统影响 操作过程中需要重启Oozie服务。重启过程中,Oozie服务无法提供服务。 前提条件 已安装Oozie、ZooKeeper服务,且服务正常运行。 没有任务正在运行。
执行中的查询总数”,检查阈值大小。 修改阈值大小。 选择“实例”页签,勾选所有“Impalad”实例并重启。 重启全部实例,服务不可用。重启单个实例,会导致当前实例节点正在执行的任务失败,服务可用。 重启完成后告检查警是否消失。 是,操作结束。 否,执行5。 收集故障信息。 在FusionInsight
单击“确定”,等待界面提示“操作成功”后单击“完成”。 在omm用户所在行,单击“操作”列下的“重启OMS服务”,重启OMS数据库。 如果修改了密码但未重启OMS数据库,则omm用户的状态变为“Waiting to restart”且无法再修改密码,直到重启OMS数据库。 在弹出的对话框中,勾选“我已阅读此信息并了解
er调整资源基数,并自定义资源配置组。 配置MRS集群静态资源对系统的影响 配置静态服务池后,受影响的服务的配置状态将配置过期,需要重启服务,重启期间服务不可用。 配置静态服务池后,各服务及角色实例使用的最大资源将不能超过限制。 配置静态资源(3.x及之后版本) 修改资源调整基数
提交中的查询总数”,检查阈值大小。 修改阈值大小。 选择“实例”页签,勾选所有“Impalad”实例并重启。 重启全部实例,服务不可用。重启单个实例,会导致当前实例节点正在执行的任务失败,服务可用。 重启完成后检查告警是否消失。 是,操作结束。 否,执行5。 收集故障信息。 在FusionInsight
x及之前版本,请单击“保存配置”,勾选“重启角色实例”并单击“确定”,重启角色实例。 等待界面提示“操作成功”,单击“完成”,配置已修改。 角色实例配置参数修改后,如果实例状态为“配置过期”则需要重启此实例,可在“实例”页面勾选“配置过期”的实例,选择“更多 > 重启实例”。 配置参数前包含图
用。两个集群都需要配置。 该任务指导MRS集群管理员在MRS修改参数以启用集群间拷贝功能。 对系统的影响 启用集群间复制功能需要重启Yarn,服务重启期间无法访问。 前提条件 两个集群HDFS的参数“hadoop.rpc.protection”需使用相同的数据传输方式。设置为“p
MRS 3.x版本暂不支持在管理控制台执行本章节操作。 当前MRS集群中,服务和实例是否支持滚动重启如表1所示。 表1 服务和实例是否支持滚动重启 服务 实例 是否支持滚动重启 Alluxio AlluxioJobMaster 是 AlluxioMaster Flink FlinkResource
勾选“我已阅读此信息并了解其影响”,单击“确定”。 密码修改完成后,选择“更多 > 重启服务”,在弹出窗口中输入当前登录的用户密码,单击“确定”,勾选“同时重启上层服务。”,单击“确定”开始重启服务。 修改MRS集群组件数据库用户密码(MRS 2.x及之前版本) 在MRS Man
产生告警的服务名称。 角色名 产生告警的角色名称。 主机名 产生告警的主机名。 对系统的影响 HBase可用的直接内存不足,可能会造成节点重启。在节点重启过程中,该节点上的读写请求时延会变大或者失败。 可能原因 该节点HBase服务直接内存使用率过大,或配置的直接内存不合理,导致使用率超过阈值。
收集ClickHouse系统表转储日志 本章节适用于MRS 3.3.0-LTS及之后版本。 操作场景 在日常使用ClickHouse时,如果出现一些异常故障,需要紧急重启恢复业务,在紧急重启之前,需要及时转储ClickHouse各系统表状态信息,用于问题定位,提升ClickHouse问题定位的效率。 针对不同的系统表
20”。 单击“保存”,保存配置。单击“实例”,勾选配置过期的BE实例,选择“更多 > 重启实例”,重启Doris BE实例。 在BE实例重启期间,运行在对应BE节点上的任务会失败,未进行重启的BE节点上的任务不受影响。 查看该告警是否清除。 是,处理完毕。 否,执行8。 收集故障信息。
登录FusionInsight Manager,选择“集群 > 服务 > Hive > 实例”,勾选所有WebHCat实例,选择“更多 > 重启实例”,等待WebHCat重启成功即可。 父主题: 使用Hive
求较高用户可以采用以下方式进行加密。 该章节仅适用于MRS 3.x及之后版本。 对系统的影响 执行加密操作时,会自动重启Controller和所有Agent,重启期间会造成FusionInsight Manager暂时中断。 大集群下会导致管理节点性能有所下降,建议集群不超过200节点时开启该功能。
产生告警的服务名称。 角色名 产生告警的角色名称。 主机名 产生告警的主机名。 对系统的影响 HBase可用内存不足,可能会造成节点重启。在节点重启过程中,该节点上的读写请求时延会变大或者失败。 可能原因 该节点HBase服务堆内存使用率过大,或配置的堆内存不合理,导致使用率超过阈值。
DBServer实例一直处于Restoring状态 问题背景与现象 DBServer实例状态一直是Restoring状态,重启之后仍然不恢复。 原因分析 DBService组件会对“${BIGDATA_HOME}/MRS_XXX/install/dbservice/ha/modu