检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
对系统的影响 FlinkServer主备之间的心跳中断有很多原因,如果是主节点出问题,那么心跳中断后备节点会升为主节点,继续对外提供服务;如果是因为其他原因,比如网络问题导致心跳中断,很可能会出现双主的现象,因为备节点也会升为主节点,会导致主备数据同步出现问题,但Flinkserver
执行以下命令确认主备管理节点。
对系统的影响 无法同步集群中HBase的数据到备集群,同步数据积压,导致大量主备数据不一致,使得容灾主备倒换或者双读从备集群读取不到最新的数据。如果持续不处理,还会导致主集群的存储空间以及ZooKeeper节点被大量积压,最终导致主集群服务故障。
如果对接了DataArts Studio服务,请检查DataArts Studio作业是否使用过期的用户密码, 如果使用请前往DataArts Studio管理中心修改密码后重新执行故障作业。 等待次日凌晨1点之后,观察告警是否自动清除。 是,操作结束。 否,执行5。
华为云的安全责任在于保障其所提供的IaaS、PaaS和SaaS各类各项云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身,也包括运维运营安全,以及更广义的安全合规遵从。
如果对接了DataArts Studio服务,请检查DataArts Studio作业是否使用即将过期的用户密码, 如果使用请前往DataArts Studio管理中心修改密码防止业务受到影响, 否则可能存在作业大规模失败风险。 等待次日凌晨1点之后,观察告警是否自动清除。
对系统的影响 无法同步集群中HBase的数据到备集群,导致主备集群数据不一致。 可能原因 备集群HBase服务异常。 网络异常。 处理步骤 观察告警是否自动修复。 登录MRS集群详情页面,选择“告警管理”。
“dfs.namenode.rpc-address.haclusterX.remotenn1”和“dfs.namenode.rpc-address.haclusterX.remotenn2”不区分主备NameNode。
配置HBase只读模式集群允许修改数据的IP白名单 MRS 3.x及之后版本,当HBase集群开启Replication功能时,为了保护主备集群的HBase数据一致性,对备集群HBase增加了数据修改操作的保护。
当备NameNode存储元数据时,断电后备NameNode启动失败 问题 当Standby NameNode存储元数据(命名空间)时,出现断电的情况,Standby NameNode启动失败并发生如下错误信息。
当备NameNode存储元数据时,断电后备NameNode启动失败 问题 当Standby NameNode存储元数据(命名空间)时,出现断电的情况,Standby NameNode启动失败并发生如下错误信息。
对系统的影响 DBService主备间心跳中断时只有一个节点提供服务,一旦该节点故障,再无法切换到备节点,就会服务不可用。 可能原因 主备DBService节点间链路异常。 处理步骤 检查主备DBService服务器间的网络是否正常。 登录MRS集群详情页面,选择“告警管理”。
对系统的影响 如果主Manager进程异常,主备倒换无法进行,影响业务。 可能原因 主备Manager节点间链路异常。 处理步骤 检查主备Manager服务器间的网络是否正常。
原因分析 备NameNode会周期性做合并editlog,生成fsimage文件的过程叫做checkpoint。备NameNode在新生成fsimage后,会将fsimage传递到主NameNode。
AOS资源为单主资源,一般资源异常会导致主备倒换,看到告警时,基本已经主备倒换,并在新主环境上启动新的ACS资源,告警恢复。该告警用于提示用户,Manager主备倒换的原因。 MRS 3.3.1及之后版本,告警名称从“aos资源异常”变成“Manager aos资源异常”。
是否需要切换HBase主备集群,即主变成备,备变成主。如果不切换,数据将不再同步。 是,先执行HBase容灾主备集群倒换,具体请参考HBase容灾集群主备倒换,然后再执行12。 否,直接执行12。 启动上层业务。 父主题: HBase集群容灾高可用
yarn-switch-resourcemanager.log Yarn主备倒换运行日志。
hdfs dfs -mkdir Jar包存放在hdfs中的路径 执行以下命令将在Maven中心仓下载的Jar包和在Past Releases下载的Jar包上传至HDFS中。
Tomcat资源为单主资源,一般资源异常会导致主备倒换,看到告警时,基本已经主备倒换,并在新主环境上启动新的Tomcat资源,告警恢复。该告警用于提示用户,Manager主备倒换的原因。
ACS资源为单主资源,一般资源异常会导致主备倒换,看到告警时,基本已经主备倒换,并在新主环境上启动新的ACS资源,告警恢复。该告警用于提示用户,Manager主备倒换的原因。 MRS 3.3.1及之后版本,告警名称从“acs资源异常”变成“Manager acs资源异常”。