MAPREDUCE服务 MRS-Hudi常见配置参数:同步Hive表配置

时间:2024-11-28 01:44:33

同步Hive表配置

表2 同步Hive表参数配置

参数

描述

默认值

hoodie.datasource.hive_sync.enable

是否同步Hudi表信息到Hive Metastore。

注意:

建议该值设置为true,统一使用Hive管理Hudi表。

false

hoodie.datasource.hive_sync.database

要同步给Hive的数据库名。

default

hoodie.datasource.hive_sync.table

要同步给Hive的表名,建议这个值和hoodie.datasource.write.table.name保证一致。

unknown

hoodie.datasource.hive_sync.username

同步Hive时,指定的用户名。

hive

hoodie.datasource.hive_sync.password

同步Hive时,指定的密码。

hive

hoodie.datasource.hive_sync.jdbcurl

连接Hive JDBC指定的连接。

""

hoodie.datasource.hive_sync.use_jdbc

是否使用Hive JDBC方式连接Hive同步Hudi表信息。

建议该值设置为false,设置为false后JDBC连接相关配置无效。

true

hoodie.datasource.hive_sync.partition_fields

用于决定Hive分区列。

""

hoodie.datasource.hive_sync.partition_extractor_class

用于提取Hudi分区列值,将其转换成Hive分区列。

org.apache.hudi.hive.SlashEncodedDayPartitionValueExtractor

hoodie.datasource.hive_sync.support_timestamp

当hudi表存在timestamp类型字段时,需指定此参数为true,以实现同步timestamp类型到hive元数据中。

该值默认为false,默认将timestamp类型同步为bigInt,默认情况可能导致使用sql查询包含timestamp类型字段的hudi表出现错误。

true

support.huaweicloud.com/cmpntguide-lts-mrs/mrs_01_24032.html