华为云首页用户手册

MAPREDUCE服务 MRS-优化小文件场景下的Spark SQL性能:配置描述

MAPREDUCE服务 MRS-优化小文件场景下的Spark SQL性能:配置描述

时间：2024-06-29 16:25:02

MAPREDUCE服务 MRS Spark SQL性能调优

配置描述

要启动小文件优化，在Spark客户端的“spark-defaults.conf”配置文件中进行设置。

表1 参数说明
参数	描述	默认值
spark.sql.files.maxPartitionBytes	在读取文件时，将单个分区打包的最大字节数。单位：byte。	134217728（即128M）
spark.files.openCostInBytes	打开文件的预估成本，按照同一时间能够扫描的字节数来测量。当一个分区写入多个文件时使用。高估更好，这样小文件分区将比大文件分区更先被调度。	4M

上一篇：MAPREDUCE服务 MRS-优化小文件场景下的Spark SQL性能:配置场景

下一篇：MAPREDUCE服务 MRS-优化小文件场景下的Spark SQL性能:配置场景

华为云11.11 2核1G 2M 云服务器

29元/年

立即注册领万元上云礼券

抽奖赢11111元免单

续费同价 L实例 2核2G 4M

98元/年

热门域名 1元随心购

1元/年

MAPREDUCE服务 MRS-优化小文件场景下的Spark SQL性能:配置描述

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题