检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
sh ${BIGDATA_HOME}/OMSV100R001C00x8664/workspace0/ha/module/hacom/script/status_ha.sh OLdap资源在主节点为Active_normal状态,在备节点为Standby_normal状态表示正常:
(需执行主备倒换操作) GAUSSDB运行日志 gaussdb.log 记录数据库运行信息 gs_ctl-current.log 记录gs_ctl工具的操作 gs_guc-current.log 记录gs_guc工具的操作,主要是参数修改 gaussdbinstall.log gaussDB
大数据组件 解决Yarn的ResourceManager频繁主备倒换的问题 解决Yarn的NodeManager健康检查太敏感的问题 解决Yarn健康检查误采集备节点健康状态,导致上报服务不可用告警的问题 解决Ldapserver数据不同步的问题 解决安装MRS 3.1.2-LTS
vim /opt/executor/bin/catalina.sh 重启manager-executor进程,该进程在Master1和Master2节点上为主备部署,同一时刻只有一个节点上运行该进程,首先确认节点上是否有该进程,如果有该进程则进行重启操作。
HA JobManager支持主备模式,保证无单点故障。 水平扩展能力 TaskManager支持手动水平扩展。 Flink DataStream API提供Scala和Java两种语言的开发方式,如表1所示。
选择“集群 > 待操作集群的名称 > 服务 > Hue > 实例”,查看Hue服务主备是否正常。 是,执行7。 否,执行3。 单击“配置”,检查Hue配置项“HUE_FLOAT_IP”和“HTTP_PORT”是否正确。 是,执行4。 否,修改正确的Hue服务浮动IP地址与端口。
在HDFS“实例”界面,勾选主备NameNode实例,选择“更多 > 滚动重启实例”,等待滚动重启完成生效。 父主题: HDFS企业级能力增强
单击“服务管理 > LdapServer > 服务配置”,记录LdapServer的端口号为PORT(若告警定位信息中的IP地址为oms备节点IP地址,则端口号为默认端口21750)。
mapred-switch-jhs.log MR主备倒换日志。 env.log 实例启停前的环境信息日志。 审计日志 mapred-audit-jobhistory.log MR操作审计日志。 SecurityAuth.audit MR安全审计日志。
yarn-switch-resourcemanager.log Yarn主备倒换运行日志。 ranger-yarn-plugin-enable.log Yarn启用Ranger鉴权的日志。
重启主ResourceManager实例,会发生ResourceManager实例主备倒换,倒换过程中,Yarn无法提交新作业,已提交的作业不受影响。Yarn组件以及依赖Yarn的组件会出现短暂的服务不可用告警。 重启备ResourceManager实例,服务业务不受影响。
iptables -D INPUT 待删除的编号 例如,删除编号为1的规则,执行: iptables -D INPUT 1 以root用户通过备管理节点的IP地址登录备管理节点,并重复4到9。 配置集群LDAP信任的IP地址 登录FusionInsight Manager。
重启主ResourceManager实例,会发生ResourceManager实例主备倒换,倒换过程中,Yarn无法提交新作业,已提交的作业不受影响。Yarn组件以及依赖Yarn的组件会出现短暂的服务不可用告警。 重启备ResourceManager实例,服务业务不受影响。
加固LDAP MRS集群中针对LDAP做了如下功能增强: LDAP配置文件中管理员密码使用SHA加密,当升级openldap版本为2.4.39或更高时,主备LDAP节点服务自动采用SASL External机制进行数据同步,避免密码信息被非法获取。
登录Manager界面,查看Spark的JDBCServer实例的主备状态是否未知。 是,执行5。 否,联系运维人员处理。 重启两个JDBCServer实例,查看主备实例状态恢复正常且zk下面有了目标目录和数据,作业即可恢复正常。若实例状态没有恢复请联系华为云支持人员处理。
前提条件 已确认主备管理节点IP。 配置Controller与Agent间数据传输加密 以omm用户登录到主管理节点。 执行以下命令,防止超时退出。 TMOUT=0 执行完本章节操作后,请及时恢复超时退出时间,执行命令TMOUT=超时退出时间。
主备Master节点的原始客户端全量更新,请参见更新客户端配置(2.x及之前版本)。 自行搭建的客户端全量安装方法,请参见安装客户端(2.x及之前版本)。 重新安装客户端前建议先对老客户端进行备份。 若您根据业务场景修改过客户端配置,请重装客户端后再次修改客户端配置。
检查集群是否有安装紧急补丁 登录客户集群的主备节点,进入“/home/omm”目录。 查看是否存在紧急补丁的目录,比如MRSxxx或者xxxpatch。 是,需要详细评估紧急补丁的兼容性。 否,检查结束。
所有Core节点升级完成后,参考1~11的操作先升级备Master节点,再升级主Master节点。 父主题: 集群管理类
su - omm cd /opt/Bigdata/patches/MRS_3.1.0.0.16/package sh rollback_package.sh 登录集群备OMS节点,执行以下命令。