MAPREDUCE服务 MRS-SparkSQL建表参数规范:规则
规则
- 建表必须指定primaryKey和preCombineField。
Hudi表提供了数据更新的能力和幂等写入的能力,该能力要求数据记录必须设置主键用来识别重复数据和更新操作。不指定主键会导致表丢失数据更新能力,不指定preCombineField会导致主键重复。
参数名称
参数描述
输入值
说明
primaryKey
hudi主键
按需
必须指定,可以是复合主键但是必须全局唯一。
preCombineField
预合并键,相同主键的多条数据按该字段进行合并
按需
必须指定,相同主键的数据会按该字段合并,不能指定多个字段。
- 禁止建表时将hoodie.datasource.hive_sync.enable指定为false。
指定为false将导致新写入的分区无法同步到Hive Metastore中。由于缺失新写入的分区信息,查询引擎读取该时会丢数。
- 禁止指定Hudi的索引类型为INMEMORY类型。
- GaussDB如何建主键_数据库索引设计规范_高斯数据库如何建主键-华为云
- 流水线参数使用
- GaussDB数据库参数调优_GaussDB版本_高斯数据库参数调优
- MapReduce服务_什么是MapReduce服务_什么是HBase
- 文档数据库服务DDS参数模板管理_MongoDB参数管理_华为云
- 云渲染_渲染云_云渲染参数设置
- GaussDB设置默认值_GaussDB存储过程_高斯数据库设置默认值-华为云
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- GaussDB命令_GaussDB数据库命令_高斯数据库命令-华为云
- ModelArts推理部署_OBS导入_模型包规范-华为云