MAPREDUCE服务 MRS-Hudi支持Partial Update:使用约束
使用约束
- 由于Hudi OCC特性的限制,当前不建议多流并发写Hudi表。 如果需要多流同时写请将所有流union后写入Hudi。
- 支持添加新列并作为新分组,但是新列添加后,需要同时修改表属性的tblproperties和serdeproperties属性,将新列添加到新的组里面。命令示例如下:
- 添加新列col5,col6,group_3:
alter table testTable add columns (col5 int, col6 int, group_3 int);
- 添加新的分组信息到tblproperties中:
alter table testTable set tblproperties('fields.group_3.sequence-group' = 'col5,col6');
- 添加新的分组信息到serdeproperties中:
alter table testTable set serdeproperties('fields.group_3.sequence-group' = 'col5,col6');
- 添加新列col5,col6,group_3:
- sequence组包含的列不能有重叠。sequence-1组和sequence-2都包含col1这一列,这种是不支持的。
- group列的数据类型,仅支持int、bigint、float、double、date和timestamp。
- 对于已存在表,如果要开启部分列更新功能;需要严格执行如下步骤,否则会出现数据不符合预期的情况。
- 停止待修改表的数据写入。
- MOR表需要执行全量compaction:
set hoodie.compaction.inline.max.delta.commits=1;
set hoodie.compact.inline=true;
执行全量compaction
run compaction on my_table;
reset hoodie.compaction.inline.max.delta.commits;
- 添加新的分组信息到tblproperties中:
alter table testTable set tblproperties('fields.group_1.sequence-group' = 'col1,col2');
- 添加新的分组信息到serdeproperties中:
alter table testTable set serdeproperties('fields.group_1.sequence-group' = 'col1,col2');
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- MapReduce服务_什么是Hue_如何使用Hue
- MapReduce服务_什么是HetuEngine_如何使用HetuEngine
- MapReduce服务_什么是Kafka_如何使用Kafka
- GaussDB主键生成_GaussDB存储过程_高斯数据库主键生成_华为云
- MapReduce服务_什么是ZooKeeper_如何使用ZooKeeper
- MapReduce服务_什么是ClickHouse_如何使用ClickHouse
- MapReduce服务_什么是Hive_如何使用Hive
- MapReduce服务_什么是Yarn_如何使用Yarn
- MapReduce服务_什么是Flink_如何使用Flink