MAPREDUCE服务 MRS-Hudi支持Partial Update:场景说明
场景说明
当前开源社区提供了PartialUpdateAvroPayload机制实现部分列更新,但该功能在多流更新,每条流更新不同列场景下会出现数据相互覆盖的问题。
通过引入sequence组的概念,Hudi可以很好的解决该问题,实现真正的部分更新。
按建表时按需求,将表中的列切分成不同的sequence组。每一个sequence组包含的列是否更新,由该sequence组的precombine字段决定,不同sequence组相互不影响。
- GaussDB主键生成_GaussDB存储过程_高斯数据库主键生成_华为云
- MapReduce服务_什么是MapReduce服务_什么是HBase
- MapReduce服务_什么是Hive_如何使用Hive
- 华为云存储网关是什么_云存储网关使用场景_云存储网关支持哪些协议
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- MPA遵从性说明通用指南
- GaussDB支持的函数_GaussDB函数类型解析_高斯数据库支持的函数-华为云
- MapReduce服务_什么是Hue_如何使用Hue
- MapReduce服务_什么是HetuEngine_如何使用HetuEngine
- MapReduce服务_什么是Kafka_如何使用Kafka