华为云首页用户手册

MAPREDUCE服务 MRS-Hudi表模型设计规范:建议

MAPREDUCE服务 MRS-Hudi表模型设计规范:建议

时间：2024-11-06 21:54:31

MAPREDUCE服务 MRS Hudi数据表设计规范

建议

Spark批处理场景，对写入时延要求不高的场景，采用COW表。
COW表模型中，写入数据存在写放大问题，因此写入速度较慢；但COW具有非常好的读取性能力。而且批量计算对写入时延不是很敏感，因此可以采用COW表。
Hudi表的写任务要开启Hive元数据同步功能。
SparkSQL天然与Hive集成，无需考虑元数据问题。该条建议针对的是通过Spark Datasource API或者Flin写Hudi表的场景，通过这两种方式写Hudi时需要增加向Hive同步元数据的配置项；该配置的目的是将Hudi表的元数据统一托管到Hive元数据服务中，为后续的跨引擎操作数据以及数据管理提供便利。

上一篇：MAPREDUCE服务 MRS-Hudi表模型设计规范:规则

下一篇：MAPREDUCE服务 MRS-Hudi表模型设计规范:规则

新客秒杀 2核2G 3M L实例

68元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

MAPREDUCE服务 MRS-Hudi表模型设计规范:建议

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题