检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
SEQ”等关于数据库信息。 回答 该现象可能出现在安装两个RangerAmdin实例的场景下。 启动失败后,请先手动重启一个RangerAdmin,然后再逐步重启其他实例。 父主题: Ranger常见问题
进程被终止如何定位原因 问题背景与现象 在某环境出现DataNode异常重启,且确认此时未从页面做重启DataNode的操作,需要定位是什么进程终止了DataNode服务端进程。 原因分析 常见的进程被异常终止有2种原因: Java进程OOM被终止 一般Java进程都会配置OOM
DBServer启动失败 问题背景与现象 DBService组件启动失败,重启还是失败,实例状态一直为正在恢复状态。 图1 DBService 的状态 原因分析 查看DBService的日志/var/log/Bigdata/dbservice/DB/gs_ctl-current.log,报如下错误。
)功能,防止单节点故障以及多节点同时处理一个任务。 本章节内容仅适用于MRS 3.1.2及之后版本。 对系统影响 操作过程中需要重启Oozie服务。重启过程中,Oozie服务无法提供服务。 前提条件 已安装Oozie、ZooKeeper服务,且服务正常运行。 没有任务正在运行。
/opt/Bigdata/om-0.0.1/sbin/restart-controller.sh重启Controller。 请在Manager页面没有其他操作后重启Controller,重启Controller对大数据组件业务无影响。 重新执行1~7同步ResourceManager的配置并检查配置是否正常。
执行中的查询总数”,检查阈值大小。 修改阈值大小。 选择“实例”页签,勾选所有“Impalad”实例并重启。 重启全部实例,服务不可用。重启单个实例,会导致当前实例节点正在执行的任务失败,服务可用。 重启完成后告检查警是否消失。 是,操作结束。 否,执行5。 收集故障信息。 在FusionInsight
er调整资源基数,并自定义资源配置组。 配置MRS集群静态资源对系统的影响 配置静态服务池后,受影响的服务的配置状态将配置过期,需要重启服务,重启期间服务不可用。 配置静态服务池后,各服务及角色实例使用的最大资源将不能超过限制。 配置静态资源(3.x及之后版本) 修改资源调整基数
提交中的查询总数”,检查阈值大小。 修改阈值大小。 选择“实例”页签,勾选所有“Impalad”实例并重启。 重启全部实例,服务不可用。重启单个实例,会导致当前实例节点正在执行的任务失败,服务可用。 重启完成后检查告警是否消失。 是,操作结束。 否,执行5。 收集故障信息。 在FusionInsight
单击“确定”,等待界面提示“操作成功”后单击“完成”。 在omm用户所在行,单击“操作”列下的“重启OMS服务”,重启OMS数据库。 如果修改了密码但未重启OMS数据库,则omm用户的状态变为“Waiting to restart”且无法再修改密码,直到重启OMS数据库。 在弹出的对话框中,勾选“我已阅读此信息并了解
x及之前版本,请单击“保存配置”,勾选“重启角色实例”并单击“确定”,重启角色实例。 等待界面提示“操作成功”,单击“完成”,配置已修改。 角色实例配置参数修改后,如果实例状态为“配置过期”则需要重启此实例,可在“实例”页面勾选“配置过期”的实例,选择“更多 > 重启实例”。 配置参数前包含图
用。两个集群都需要配置。 该任务指导MRS集群管理员在MRS修改参数以启用集群间拷贝功能。 对系统的影响 启用集群间复制功能需要重启Yarn,服务重启期间无法访问。 前提条件 两个集群HDFS的参数“hadoop.rpc.protection”需使用相同的数据传输方式。设置为“p
MRS 3.x版本暂不支持在管理控制台执行本章节操作。 当前MRS集群中,服务和实例是否支持滚动重启如表1所示。 表1 服务和实例是否支持滚动重启 服务 实例 是否支持滚动重启 Alluxio AlluxioJobMaster 是 AlluxioMaster Flink FlinkResource
勾选“我已阅读此信息并了解其影响”,单击“确定”。 密码修改完成后,选择“更多 > 重启服务”,在弹出窗口中输入当前登录的用户密码,单击“确定”,勾选“同时重启上层服务。”,单击“确定”开始重启服务。 修改MRS集群组件数据库用户密码(MRS 2.x及之前版本) 在MRS Man
产生告警的服务名称。 角色名 产生告警的角色名称。 主机名 产生告警的主机名。 对系统的影响 HBase可用的直接内存不足,可能会造成节点重启。在节点重启过程中,该节点上的读写请求时延会变大或者失败。 可能原因 该节点HBase服务直接内存使用率过大,或配置的直接内存不合理,导致使用率超过阈值。
收集ClickHouse系统表转储日志 本章节适用于MRS 3.3.0-LTS及之后版本。 操作场景 在日常使用ClickHouse时,如果出现一些异常故障,需要紧急重启恢复业务,在紧急重启之前,需要及时转储ClickHouse各系统表状态信息,用于问题定位,提升ClickHouse问题定位的效率。 针对不同的系统表
20”。 单击“保存”,保存配置。单击“实例”,勾选配置过期的BE实例,选择“更多 > 重启实例”,重启Doris BE实例。 在BE实例重启期间,运行在对应BE节点上的任务会失败,未进行重启的BE节点上的任务不受影响。 查看该告警是否清除。 是,处理完毕。 否,执行8。 收集故障信息。
求较高用户可以采用以下方式进行加密。 该章节仅适用于MRS 3.x及之后版本。 对系统的影响 执行加密操作时,会自动重启Controller和所有Agent,重启期间会造成FusionInsight Manager暂时中断。 大集群下会导致管理节点性能有所下降,建议集群不超过200节点时开启该功能。
登录FusionInsight Manager,选择“集群 > 服务 > Hive > 实例”,勾选所有WebHCat实例,选择“更多 > 重启实例”,等待WebHCat重启成功即可。 父主题: 使用Hive
产生告警的服务名称。 角色名 产生告警的角色名称。 主机名 产生告警的主机名。 对系统的影响 HBase可用内存不足,可能会造成节点重启。在节点重启过程中,该节点上的读写请求时延会变大或者失败。 可能原因 该节点HBase服务堆内存使用率过大,或配置的堆内存不合理,导致使用率超过阈值。
为“-Xms32G -Xmx32G -XX:NewSize=2G -XX:MaxNewSize=3G”。 重启一个NameNode,确认该NameNode可以正常启动。 重启另一个NameNode,确认页面状态恢复。 父主题: 使用HDFS