检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云容灾网关drm进程启动失败,如何处理? 问题描述 安装部署完容灾网关或者代理客户端后,drm进程启动失败。 根因分析 可能由以下原因导致: 原因1:service账号对“/dev/null”目录没有写权限。 原因2:本机无法解析hostname域名。 处理方法1 赋予servi
ail 查看返回值是否小于500,若小于500,需安装haveged,以满足加密程序对系统熵的要求;系统熵不足会导致线程阻塞问题,网关drm进程存在,7443端口监听很慢或不被监听 。 解决方法: 使用haveged对/dev/random补熵,下载,安装并启动haveged。 查看熵值,与初始熵值对比。
容灾资源是否需要手动创建? 通过SDRS创建保护实例时,生产站点资源为用户手动创建的已有资源,SDRS会自动创建容灾站点所需的资源,不需要用户手动进行创建。创建的容灾站点资源,需要按需收取所使用的ECS和EVS资源的费用,容灾站点创建的ECS默认处于关机状态。ECS和EVS的计费情况请分别参考对应服务的价格详情。
如果设置密码方式登录云服务器,根据Cloudbase-Init是否已经启动存在差异: 在Cloudbase-Init未启动的情况下(一般是生产站点服务器开机后的3-5分钟内),仍然可以使用云服务器B的密码进行登录。 当Cloudbase-Init启动完成后,云服务器B在切换/故障切换前设置的密码
204" >> linux-host-list.txt 执行以下命令查询是否添加完成。 cat linux-host-list.txt 以root权限执行以下安装命令,批量安装代理客户端。 /opt/cloud/sdrs/sidecar/script/cmd_tools.sh install
配置文件/etc/cloud/cloud.cfg,将“preserve_hostname: false”修改为“preserve_hostname: true”。 具体操作如下: 登录生产站点服务器。 执行以下命令,编辑配置文件“/etc/cloud/cloud.cfg”。 sudo
等待几分钟后查看剩下的服务器是否安装成功。。 /opt/cloud/sdrs/sidecar/script/cmd_tools.sh list 若上述步骤中依然查看不到对应的客户端,则查看windows-host-list.txt文件中的密码输入是否正确。 父主题: 批量管理代理客户端
启用容灾站点可用区内的云服务器和云硬盘等资源,以确保业务正常运行。 如果启动故障切换,容灾站点的服务器和磁盘将立刻可用。您可上电服务器,或结合云备份服务将数据恢复至您指定的具有应用一致性的数据恢复点。 启动故障切换的同时,数据同步停止。 故障切换完成后,保护组的状态变为“故障切换
删除保护实例不会删除生产站点的云服务器资源,对生产站点业务无影响。 使用须知 保护实例反向重保护后初始同步过程中,如果删除保护实例,生产站点服务器可能无法启动,建议等初始同步完成后再删除保护实例。 前提条件 待删除的保护实例有其它操作正在执行时,不可以执行删除操作。 操作步骤 登录管理控制台。 单击服务列表,选择“存储
于组件间认证。 执行以下命令,查看云容灾网关进程是否已启动。 ps -ef | grep java | grep drm 回显如下类似信息: service 2089 1 5 10:25 ? 00:01:12 /opt/cloud/sdrs/drm/tools/jre/bin/java
容灾站点可能需要利用应用或文件系统的崩溃修复功能进行修复,大多数情况下可以将数据恢复到一致状态并正常使用。 处理建议 示例:切换后容灾机器启动失败,发生XFS异常(LSN校验失败),OS进入紧急模式。 修复手段:执行journalctl命令,确认xfs文件系统异常报错;在emergency
重保护 操作场景 启动故障切换的同时,数据同步停止。故障切换完成后,保护组处于停止保护状态,如需重新开始数据同步,可参考本章节执行重保护操作。 前提条件 重保护前保护组中必须包含复制对。 保护组状态为“故障切换”或者“重保护失败”。 容灾站点服务器关机。 操作步骤 登录管理控制台。
s安装代理客户端步骤。 获取代理客户端软件包到网关服务器的/opt/cloud目录,并比对软件包的sha256值,确保安装包完整性。 IDC上云模式:通过界面链接下载软件包,并上传到网关服务器/opt/cloud目录; 跨区域和跨可用区模式:在服务控制台页面选择生产站点服务器的操
20240627203949.tar.gz”为例。 在/opt/cloud/sdrs目录下,执行以下命令,配置云容灾网关。 sh register_gateway.sh 图1 执行脚本 跨AZ场景配置参数: 图2 跨AZ场景脚本执行参数示例 表1 跨AZ场景参数说明 参数 参数说明 获取方法
当生产站点可用区内的云服务器和云硬盘由于不可抗力导致物理环境故障时,可参考本章节执行故障切换操作,启用容灾站点可用区内的云服务器和云硬盘等资源,以确保业务正常运行。 如果启动故障切换,容灾站点的服务器和磁盘将立刻可用。您可上电服务器,或结合云服务器备份服务或云硬盘备份服务将数据恢复至您指定的具有应用一致性的数据恢复点。
切回 操作场景 切换完成后,当前生产业务位于容灾站点,通过切回操作,可将生产业务从容灾站点切回到生产站点。 切回为高危操作,切回后将会在生产端启动业务,需要用户保证容灾端业务已经停止,否则可能造成生产端和容灾端同时接管业务或业务冲突从而造成数据破坏或业务中断。 当创建的站点复制对为“
运行以下脚本进行网关配置 Linux服务器: sh /opt/cloud/sdrs/register_gateway.sh Windows服务器: 进入C:\cloud\sdrs 目录,双击运行register_gateway.bat脚本 图1 windows配置脚本 脚本参数填写说明:
恢复时间目标(RTO)为从生产站点发起切换或故障切换操作起,至容灾站点的服务器开始运行为止的一段时间,不包括手动操作DNS配置、安全组配置或执行客户脚本等任何时间,正常情况下,SDRS的RTO小于30分钟。 保持崩溃一致性 保证基于主机的异步复制,您容灾站点的数据与生产站点的数据保持崩溃一
更改为从容灾站点到生产站点,容灾站点可用区内的服务器和云硬盘等资源可启动。 故障切换 系统将生产站点的业务强制置为不可启动,将容灾站点的业务设置为可启动。该动作影响保护组内的所有保护实例,故障切换后,租户需要启动容灾站点的服务器。故障切换后,保护组进入故障切换状态,并中断数据同步,需要通过重保护来恢复数据同步。
恢复时间目标(RTO)为从生产站点发起切换或故障切换操作起,至容灾站点的服务器开始运行为止的一段时间,不包括手动操作DNS配置、安全组配置或执行客户脚本等任何时间,正常情况下,SDRS的RTO小于30分钟。 保持崩溃一致性 保证基于主机的异步复制,您容灾站点的数据与生产站点的数据保持崩溃一