数据治理中心 DATAARTS STUDIO-SQLServer同步到MRS Hudi:注意事项

时间:2024-12-23 15:50:35

注意事项

除了数据源版本、连接账号权限及同步对象范围外,您还需要注意的事项请参见下表。

表4 注意事项

类型名称

使用和操作限制

数据库限制

  • 目标数据库中的库名、表名、字段名仅支持数字、字母和下划线,且字段名必须以字母或下划线开头,建议尽量使用常规字符避免任务失败。
  • 源数据库如果开启客户端配置中的“强制协议加密(Force Protocol Encrypton)”,必须同时开启“信任服务器证书(trust server certificate)”,如下图所示:
    图2 查看客户端属性

使用限制

通用:

  • 实时同步过程中,不支持IP、端口、账号、密码修改。
  • Hudi表使用Bucket索引的场景下不允许更新分区键,否则可能产生重复数据。
  • Hudi表使用Bucket索引的场景下主键仅保证单分区内唯一。
  • 本链路所使用的Hudi表需带有3个审计字段:cdc_last_update_date、logical_is_deleted、_hoodie_event_time,并会以_hoodie_event_time作为Hudi表的预聚合键。因此,若使用已存在的表,也需要携带这3个审计字段,否则可能导致任务异常。
    • cdc_last_update_date:Migration任务处理CDC数据的时间。
    • logical_is_deleted:逻辑删除标志。
    • _hoodie_event_time:数据在SQLServer CDC中的时间戳。

全量同步阶段:

任务启动和全量数据同步阶段,请不要在源数据库执行DDL操作,否则可能导致任务异常。

增量同步阶段:

  • 支持DML:包括INSERT、UPDATE、DELETE。
  • 不支持DDL操作,源数据库进行的DDL操作不会同步到目标数据库。
  • 不支持大数据类型IMAGE、TEXT、NTEXT的删除操作。

常见故障排查:

在任务创建、启动、全量同步、增量同步、结束等过程中,如有遇到问题,可先参考常见问题章节进行排查。

其他限制

  • 支持目标数据库中的表比源数据库多列场景,但是需要避免以下场景可能导致的任务失败。

    目标数据库多的列要求非空且没有默认值,源数据库insert数据,同步到目标数据库后多的列为null,不符合目标数据库要求。

  • 不支持源数据库主备切换,源数据库主备切换会导致同步任务失败。
  • 不支持源数据库Microsoft SQL Server为TLS 1.0、TLS 1.1协议的同步,如果需要同步,建议源库升级到TLS 1.2及以上版本。
support.huaweicloud.com/usermanual-dataartsstudio/dataartsstudio_01_7707.html