华为云首页用户手册

MapReduce服务 MRS-小文件优化:操作步骤

MapReduce服务 MRS-小文件优化:操作步骤

时间：2025-02-12 14:58:21

MapReduce服务 MRS

操作步骤

要启动小文件优化，在Spark客户端的“spark-defaults.conf”配置文件中进行设置。

表1 参数介绍
参数	描述	默认值
spark.sql.files.maxPartitionBytes	在读取文件时，将单个分区打包的最大字节数。单位：byte。	134217728（即128M）
spark.files.openCostInBytes	打开文件的预估成本，按照同一时间能够扫描的字节数来测量。当一个分区写入多个文件时使用。高估更好，这样小文件分区将比大文件分区更先被调度。	4M

上一篇：MapReduce服务 MRS-Hudi写入小精度Decimal数据失败:回答

下一篇：MapReduce服务 MRS-Executor进程Crash导致Stage重试:问题

开年采购季抽奖赢万元免单

立即前往

续费同价 L实例 2核2G 4M

98元/年

企业专享 X实例 2核4G 5M

198元/年

热门域名 1元随心购

1元/年起

MapReduce服务 MRS-小文件优化:操作步骤

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题