数据治理中心 DATAARTS STUDIO-源端为MySQL,目的端为DMS Kafka:整库场景

时间:2024-09-13 17:14:06

整库场景

  1. 源端配置。
    添加数据源,选择需要迁移的MySQL表。
    图1 选择库表

    库与表均支持自定义选择,即可选择一库一表,也可选择多库多表。

  2. 目标端配置。
    图2 配置目标端参数
    • 设置源表与Topic映射规则:
      • 目标Topic名称规则:源端表名与目的端Topic名的映射规则,可以指定为单一Topic,也可使用内置字段做映射。

        可以使用的内置变量有:

        #{source_db_name}:源库名。

        #{source_table_name}:源库名。

      • 同步kafka partition策略:支持以下三种投递策略,源端无主键情况下,目的端默认投递到partition 0。
        • 按库名+表名的hash值投递到不同Partition。
        • 全部投递到Partition 0。
        • 按表的主键值hash值投递到不同的Partition。
      • 需要同步的数据库操作:支持同步的数据库操作为DDL和DML。
      • 投递到Kafka的数据格式:投递到Kafka的数据格式有Debezium JSON和Canal JSON。
    • 源表与目标表映射:支持用户根据实际需求修改映射后的目的端topic名称,可以配置为一对一、多对一的映射关系。
      图3 配置源表与目标表映射
support.huaweicloud.com/usermanual-dataartsstudio/dataartsstudio_01_1607.html