MAPREDUCE服务 MRS-配置Hudi分区并发控制:使用分区并发机制

时间：2024-07-02 16:40:06

MAPREDUCE服务 MRS 数据管理维护

使用分区并发机制

通过设置参数：hoodie.support.partition.lock=true来启动分区并发写。

示例：

spark datasource方式开启分区并发写：

upsert_data.write.format("hudi").
option("hoodie.datasource.write.table.type", "COPY_ON_WRITE").
option("hoodie.datasource.write.precombine.field", "col2").
option("hoodie.datasource.write.recordkey.field", "primary_key").
option("hoodie.datasource.write.partitionpath.field", "col0").
option("hoodie.upsert.shuffle.parallelism", 4).
option("hoodie.datasource.write.hive_style_partitioning", "true").
option("hoodie.support.partition.lock", "true").
option("hoodie.table.name", "tb_test_cow").
mode("Append").save(s"/tmp/huditest/tb_test_cow")

spark-sql开启分区并发写：

set hoodie.support.partition.lock=true;
insert into hudi_table1 select 1,1,1;

上一篇：MAPREDUCE服务 MRS-配置Hudi分区并发控制:注意事项

下一篇：MAPREDUCE服务 MRS-配置Hudi分区并发控制:注意事项

MAPREDUCE服务 MRS-配置Hudi分区并发控制:使用分区并发机制

意见反馈

0/200

提交取消

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

MAPREDUCE服务 MRS-配置Hudi分区并发控制:使用分区并发机制

MAPREDUCE服务 MRS-配置Hudi分区并发控制:使用分区并发机制

使用分区并发机制

7*24

备案

专业服务

退订

建议反馈

售前咨询热线