MapReduce服务 MRS-配置流式读取Spark Driver执行结果:配置描述

时间：2025-02-12 15:03:47

MapReduce服务 MRS

配置描述

提供两种不同的数据汇聚功能配置选项，两者在Spark JD BCS erver服务端的tunning选项中进行设置，设置完后需要重启JDB CS erver。

表1 参数说明
参数	说明	默认值
spark.sql.bigdata.thriftServer.useHdfsCollect	是否将结果数据保存到HDFS中而不是内存中。优点：由于查询结果保存在hdfs端，因此基本不会造成JDBCServer的OOM。缺点：速度慢。 true：保存至HDFS中。 false：不使用该功能。须知： spark.sql.bigdata.thriftServer.useHdfsCollect参数设置为true时，将结果数据保存到HDFS中，但JobHistory原生页面上Job的描述信息无法正常关联到对应的SQL语句，同时spark-beeline命令行中回显的Execution ID为null，为解决JDBCServer OOM问题，同时显示信息正确，建议选择spark.sql.userlocalFileCollect参数进行配置。	false
spark.sql.uselocalFileCollect	是否将结果数据保存在本地磁盘中而不是内存里面。优点：结果数据小数据量情况下和原生内存的方式相比性能损失可以忽略，大数据情况下（亿级数据）性能远比使用HDFS，以及原生内存方式好。缺点：需要调优。大数据情况下建议JDBCServer driver端内存10G，executor端每个核心分配3G内存。 true：使用该功能。 false: 不使用该功能。	false
spark.sql.collect.Hive	该参数在spark.sql.uselocalFileCollect开启的情况下生效。直接序列化的方式，还是间接序列化的方式保存结果数据到磁盘。优点：针对分区数特别多的表查询结果汇聚性能优于直接使用结果数据保证在磁盘的方式。缺点：和spark.sql.uselocalFileCollect开启时候的缺点一样。 true：使用该功能。 false：不使用该功能。	false
spark.sql.collect.serialize	该参数在spark.sql.uselocalFileCollect， spark.sql.collect.Hive同时开启的情况下生效。作用是进一步提升性能 java：采用java序列化方式收集数据。 kryo：采用kryo序列化方式收集数据，性能要比采用java好。	java

参数spark.sql.bigdata.thriftServer.useHdfsCollect和spark.sql.uselocalFileCollect不能同时设置为true。

上一篇：MapReduce服务 MRS-日期类型的字段作为过滤条件时匹配'2016-6-30'时没有查询结果:问题

下一篇：MapReduce服务 MRS-运行Spark Streaming任务参数调优的注意事项:回答

开年采购季抽奖赢万元免单

立即前往

续费同价 L实例 2核2G 4M

98元/年

企业专享 X实例 2核4G 5M

198元/年

热门域名 1元随心购

1元/年起

MapReduce服务 MRS-配置流式读取Spark Driver执行结果:配置描述

意见反馈

0/200

提交取消

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

MapReduce服务 MRS-配置流式读取Spark Driver执行结果:配置描述

MapReduce服务 MRS-配置流式读取Spark Driver执行结果:配置描述

配置描述

7*24

备案

专业服务

退订

建议反馈

售前咨询热线