数据复制服务 (Data Replication Service,简称DRS)支持将ECS自建 数据库 的数据同步到华为 云数据库 PostgreSQL 实例。通过DRS提供的实时同步任务,实现在数据库同步过程中业务和数据库不停机,业务中断时间最小化。
本章节主要介绍了通过DRS将ECS自建数据库实时同步至华为云数据库PostgreSQL的任务配置流程。支持以下网络场景:
· 源数据库和目标数据库属于同一个VPC网络内
· 源数据库和目标数据库属于不同VPC网络内
网络示意图
同步流程
同步建议(重要)
· 数据库同步与环境多样性和人为操作均有密切关系,为了确保同步的平顺,建议您在进行正式的数据库同步之前进行一次演练,可以帮助您提前发现问题并解决问题,如何最小化对数据库的影响请参考如下建议。
· 强烈建议您在启动任务时选择“稍后启动”功能,将启动时间设置在业务低峰期,相对静止的数据可以有效提升一次性同步成功率,避免同步对业务造成性能影响。
同步须知(重要)
须知:在创建实时同步任务之前,请您务必仔细阅读同步使用须知。参考《 数据复制 服务快速入门》中的“使用须知”章节。
同步准备
1、权限准备:
当使用DRS将ECS自建数据库PostgreSQL的数据同步到华为云数据库PostgreSQ L实例 时,在不同同步类型情况下,对源数据库和目标数据库的帐号权限要求如表1所示:
同步类型 |
全量同步 |
全量+增量同步 |
---|---|---|
源数据库 |
· 数据库:CONNENT · 模式:USAGE · 有主键表:SELECT · 无主键表:SELECT、UPDATE、DELETE、TRUNCATE · 序列:SELECT |
· 账户:REPLICATION · 数据库:CONNENT · 模式:USAGE · 有主键表:SELECT · 无主键表:SELECT、UPDATE、DELETE、TRUNCATE · 序列:SELECT |
目标数据库 |
CREATEDB |
CREATEDB、CREATEROLE |
· 源数据库的权限设置:
需要确保源数据库PostgreSQL的帐号具备表1的权限,若权限不足,需要在源数据库端创建高权限的帐号。
· 目标数据库的权限设置:
华为云数据库PostgreSQL使用初始帐号即可。
1、网络准备:
· 源数据库所在的region要和目标端华为云数据库PostgreSQL实例所在的region保持一致。
· 源数据库可以与目标端华为云数据库PostgreSQL实例在同一个VPC,也可以不在同一个VPC。
△ 当不在同一个VPC的时候,要求源数据库实例和目标端华为云数据库PostgreSQL实例所处的子网处于不同网段,此时需要通过建立对等连接实现网络互通,具体操作请参见《 虚拟私有云 用户指南》中“VPC对等连接”章节。
△ 当在同一VPC的时候,网络默认是互通的。
2、安全规则准备:
· 同一VPC场景下,默认网络是连通的,不需要单独设置安全组。
· 不同VPC场景下,通过建立对等连接就可以实现网络互通,不需要单独设置安全组。
3、其他事项准备:
DRS仅支持同步PostgreSQL部分类型的DDL语句,具体支持范围请参考相关指导。请合理规划源数据库业务,不要在同步期间产生支持范围外的DDL操作。
同步步骤
1、创建同步任务。
a)登录管理控制台,在服务列表中选择
,进入数据复制服务信息页面。b)在“实时同步管理”页面,单击右上角“创建同步任务”,进入同步任务信息页面。
c)在“同步实例”页面,填选任务名称、任务异常通知信息、描述和同步实例信息。
参数 |
描述 |
---|---|
区域 |
当前所在区域,可进行切换。 |
任务名称 |
任务名称在4-50位之间,必须以字母开头,不区分大小写,可以包含字母、数字、中划线或下划线,不能包含其他的特殊字符。 |
描述 |
描述不能超过256位,且不能包含! = < > & ' " \ 特殊字符。 |
任务异常通知设置 |
该项为可选参数,开启之后,选择对应的 SMN 主题,。当同步任务状态异常时,系统将发送通知。 |
SMN主题 |
“任务异常通知设置”项开启后可见,需提前在SMN上申请主题并添加订阅。 |
时延阈值 |
在增量同步阶段,源数据库和目标数据库之间的同步有时会存在一个时间差,称为时延,单位为秒。 时延阈值设置是指时延超过一定的值后(时延阈值范围为1—3600s),DRS可以发送告警通知给指定收件人。告警通知将在时延稳定超过设定的阈值6min后发送,避免出现由于时延波动反复发送告警通知的情况。 说明:
· 首次进入增量同步阶段,会有较多数据等待同步,存在较大的时延,属于正常情况,不在此功能的监控范围之内。 · 设置时延阈值之前,需要设置任务异常通知。 |
任务异常自动结束时间(天) |
设置任务异常自动结束天数,输入值必须在14-100之间。 说明:
异常状态下的任务仍然会计费,而长时间异常的任务无法续传和恢复。设置任务异常自动结束天数后,异常且超时的任务将会自动结束,以免产生不必要的费用。 |
参数 |
描述 |
---|---|
数据流动方向 |
选择“入云”。 |
源数据库引擎 |
选择“PostgreSQL”。 |
目标数据库引擎 |
选择“PostgreSQL” 。 |
网络类型 |
选择“VPC网络”。建议您开启SSL安全连接,SSL约降低20-30%的同步性能,但保证了数据的安全性。 |
目标数据库实例 |
选择您所创建的目标PostgreSQL实例 |
同步类型 |
全量+增量: 该模式为数据持续性实时同步,通过全量过程完成目标端数据库的初始化后,增量同步阶段通过解析日志等技术,将源端和目标端数据保持数据持续一致。 说明:
选择“全量+增量”同步模式,增量同步可以在全量同步完成的基础上实现数据的持续同步,无需中断业务,实现同步过程中源业务和数据库继续对外提供访问。 |
d)在“源库及目标库”页面,同步实例创建成功后,填选源库信息和目标库信息,建议您单击“源库和目标库”处的“测试连接”,分别测试并确定与源库和目标库连通后,勾选协议,单击“下一步”。
说明:此处源库类型分为ECS自建库和RDS实例,需要根据源数据库的实际来源选择相应的分类。两种场景下的参数配置不一样,需要根据具体场景进行配置。
· 场景一:ECS自建库源库信息配置
图5 ECS自建库场景源库信息
参数 |
描述 |
---|---|
源库类型 |
选择“ECS自建库”。 |
VPC |
源数据库实例所在的 虚拟专用网络 ,可以对不同业务进行网络隔离。您需要创建或选择所需的虚拟 私有云 。如何创建虚拟私有云,请参见《虚拟私有云用户指南》中的“创建虚拟私有云基本信息及默认子网”。 |
子网 |
通过子网提供与其他网络隔离的、可以独享的网络资源,以提高网络安全。子网在可用分区内才会有效,创建源数据库实例的子网需要开启DHCP功能,在创建过程中也不能关闭已选子网的DHCP功能。 |
IP地址或 域名 |
配置源数据库PostgreSQL实例的访问地址或域名。 |
端口 |
配置源数据库PostgreSQL实例的服务端口,可输入范围为1~65535间的整数。 |
数据库用户名 |
访问源数据库PostgreSQL的用户名。 |
数据库密码 |
访问源数据库PostgreSQL的用户名所对应的密码。 |
SSL安全连接 |
在选择公网网络进行同步任务时,为了提升数据在网络传输过程中的安全性,建议您开启SSL安全连接,对同步链路进行加密,如果开启,需要您上传CA证书。 |
· 场景二:RDS实例源库信息配置
图6 RDS实例场景源库信息
参数 |
描述 |
---|---|
源库类型 |
选择“RDS实例”。 |
数据库实例名称 |
选择待同步的关系型PostgreSQL数据库实例作为源数据库实例。 |
数据库用户名 |
访问源数据库PostgreSQL的用户名。 |
数据库密码 |
访问源数据库PostgreSQL的用户名所对应的密码。 |
图7 目标库信息
参数 |
描述 |
---|---|
数据库实例名称 |
默认为创建同步任务时选择的已创建的PostgreSQL实例,不可进行修改。 |
数据库用户名 |
访问目标端PostgreSQL实例的用户名。 |
数据库密码 |
访问目标端PostgreSQL实例的用户名所对应的密码。 |
e)在“同步设置”页面,选择同步对象和同步用户。
图8 同步模式
f)在“预检查”页面,进行同步任务预校验,校验是否可进行实时同步。
· 查看检查结果,如有不通过的检查项,需要修复不通过项后,单击“重新校验”按钮重新进行任务预校验。
预检查不通过项处理建议请参见《数据复制服务用户指南》中的“预检查不通过项修复方法”。
· 预检查完成后,且所有检查项结果均通过时,单击“下一步”。
图9 预检查
说明:所有检查项结果均通过时,若存在请确认项,需要阅读并确认详情后才可以继续执行下一步操作。
g)在“任务确认”页面,选择同步任务的启动时间,勾选协议,单击“启动任务”,提交同步任务。
说明:
· 同步任务的启动时间可以根据业务需求,设置为“立即启动”或“稍后启动”。
· 预计同步任务启动后,会对源数据库和目标数据库的性能产生影响,建议选择业务低峰期,合理设置同步任务的启动时间。
h)同步任务提交后,开始启动同步任务,您可以返回“实时同步管理”页面,查看同步任务状态。
2、任务管理。
同步任务启动后,会经历全量同步和增量同步两个阶段,对于不同阶段的同步任务,您可以进行任务管理。
· 全量同步
查看同步进度:全量同步中的任务,您可单击任务名称,在“同步进度”页签下,查看全量同步进度,您可以查看结构、数据、索引同步的进度,也查看具体同步对象的同步进度。当全量同步进度显示为100%,表示全量同步已经完成。
· 增量同步
【查看时延监控】全量同步完成后,开始进行增量同步。对于增量同步中的任务,您可单击任务名称,在“同步进度”页签下,查看增量同步同步时延,当时延为0s时,说明源数据库和目标数据库的数据是实时同步的。您也可以使用“同步对比”页签进行一致性对比。
图10 查看时延监控
【查看同步对比】为了尽可能减少业务的影响和业务中断时间,增量同步中的任务,您可单击任务名称,在“同步对比”页签下创建对比任务。
具体的同步对比操作及注意事项请参考《数据复制服务用户指南》中“对比同步项”章节。
3、割接建议。
建议您选择一个业务低峰期,开始正式系统割接流程。割接前,请您确认至少在业务低峰期有过一次完整的数据对比。可以结合数据对比的“稍后启动”功能,选择业务低峰期进行数据对比,以便得到更为具有参考性的对比结果。由于同步具有轻微的时差,在数据持续操作过程中进行对比任务,可能会出现少量数据不一致对比结果,从而失去参考意义。
a)先中断业务(如果业务负载非常轻,也可以尝试不中断业务)。
b)在源数据库端执行如下语句,并观察在1-5分钟内若无任何新会话执行SQL ,则可认为业务已经完全停止。
select * from pg_stat_activity;
说明:上述语句查询到的进程列表中,包括DRS同步实例的连接,您需要确认除DRS同步实例的连接外无任何新会话执行SQL,即可认为业务已经完全停止。
c)通过DRS同步任务监控页面进行观察同步时延,保持实时同步时延为0,并稳定保持一段时间;同时,您可以使用数据级对比功能,进行割接前的最后一次数据级对比,耗时可参考之前的对比记录。
· 如果时间允许,则选择全部对比。
· 如果时间不允许,则推荐对比活跃表,关键业务表,第二步对比多次存在差异的表等。
d)确定系统割接时机,业务系统指向华为云数据库,业务对外恢复使用,同步完成。
4、同步结束。
a)结束同步任务:业务系统和数据库切换至华为云后,为了防止源数据库的操作继续同步到目标数据库,造成数据覆盖问题,此时您可选择结束同步任务,该操作仅删除了同步实例,同步任务仍显示在任务列表中,您可以进行查看或删除。结束同步任务后,DRS将不再计费。
b)删除同步任务:对于已结束的同步任务,您可选择删除任务。该操作将一并删除同步任务,删除同步任务后,该任务将不会出现在任务列表中。