华为云首页用户手册

数据治理中心 DATAARTS STUDIO-源端为Apache Kafka，目的端为MRS Kafka:分库分表场景

数据治理中心 DATAARTS STUDIO-源端为Apache Kafka，目的端为MRS Kafka:分库分表场景

时间：2024-09-13 17:14:06

数据治理中心 DATAARTS STUDIO

分库分表场景

源端配置。
- Kafka配置。
  - 数据格式：支持的数据格式。
    目前支持JSON、 CS V、TEXT格式。
  - 消费组ID：由用户指定，标识当前实时处理集成作业的消费组。
    当迁移作业消费DMS Kafka集群某一Topic的消息后，在Kafka集群的“消费组管理”可以看到此处配置的消费组ID、在“消息查询”可以查到消费属性group.id。因为Kafka把消费消息的一方称为消费者(Consumer)，多个消费者组成一个消费组(Consumer Group)，消费组是Kafka提供的可扩展且具有容错性的消费者机制，建议配置消费组。
  - Kafka源端属性配置：支持设置Kafka的配置项，需要增加 properties. 前缀，作业将自动移除前缀并传入底层Kafka客户端，例如：properties.connections.max.idle.ms=600000。
- 添加数据源。
  图1 添加数据源

目标端配置。
图2 配置目标端参数
- 设置源表与Topic映射规则：
  - 目标Topic名称规则：源端表名与目的端Topic名的映射规则，可以指定为单一Topic，也可使用内置字段做映射。
    可以使用的内置变量有：#{source_topic_name}：源主题名
  - 同步kafka partition策略：选择kafka partition策略。
    - 按源端分区投递到对应的Partition：源端消息在第n个分区，则投递到目的端的第n个分区，该策略可以保证消息顺序。
    - 按轮询模式投递到不同的Partition：采用Kafka粘性分区策略均匀的投递到目的端主题的所有分区，该策略无法保证消息顺序。
    - 全部投递到Partition 0。
  - 新建Topic的Partition数量：设置新建Topic的Partition数量，默认为3。
  - Kafka目标端属性配置：支持设置Kafka的配置项，需要增加 properties. 前缀，作业将自动移除前缀并传入底层Kafka客户端，例如：properties.connections.max.idle.ms=600000作业提交后目标端会额外添加一个内置参数dataFormat。
- 源表与目标表映射：支持用户根据实际需求修改映射后的目的端topic名称，可以配置为一对一、多对一的映射关系。
  图3 配置源表与目标表映射

上一篇：数据治理中心 DATAARTS STUDIO-SAP HANA数据连接参数说明

下一篇：数据治理中心 DATAARTS STUDIO-源端为MySQL，目的端为DWS:分库分表场景

数据治理中心 DATAARTS STUDIO-源端为Apache Kafka，目的端为MRS Kafka:分库分表场景

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题