MAPREDUCE服务 MRS-Spark读写Hudi开发规范:Spark写Hudi各种写入模式参数规范说明
Spark写Hudi各种写入模式参数规范说明
类型 |
说明 |
开启参数 |
场景选择 |
特点 |
---|---|---|---|---|
upsert |
update + insert Hudi默认写入类型,写入具有更新能力。 |
默认,无需参数开启。
|
默认选择。 |
优点:
缺点:
|
append |
数据无更新直接写入 |
|
追求高吞吐,无数据更新场景。 |
优点:
缺点:
|
delete |
删除操作 |
无需参数,直接使用delete语法即可: delete from tableName where primaryKey='id1'; |
SQL删除数据数据场景。 |
和upsert类型一样。 |
Insert overwrite |
覆写分区 |
无需参数,直接使用insert overwrite语法即可: insert overwrite table tableName partition(dt ='2021-01-04') select * from srcTable; |
分区级别重新。 |
覆写分区。 |
Insert overwrite table |
覆写全表 |
无需参数,直接使用insert overwrite语法即可: insert overwrite table tableName select * from srcTable; |
全部重写。 |
覆写全表。 |
Bulk_insert |
批量导入 |
|
建议表初始化搬迁的时候使用。 |
和append模式一样。 |
- Hudi服务_什么是Hudi_如何使用Hudi
- MapReduce服务_什么是存算分离_如何配置MRS集群存算分离
- MapReduce工作原理_MapReduce是什么意思_MapReduce流程_MRS_华为云
- MapReduce服务_什么是ZooKeeper_如何使用ZooKeeper
- 大数据分析是什么_使用MapReduce_创建MRS服务
- MapReduce服务_什么是HDFS_HDFS特性
- MapReduce服务_什么是Flume_如何使用Flume
- MapReduce服务_什么是HetuEngine_如何使用HetuEngine
- PLM系统_服装PLM_PLM市场
- MapReduce服务_什么是MapReduce服务_什么是HBase