MAPREDUCE服务 MRS-Spark常用配置参数:Broadcast
Broadcast
Broadcast用于Spark进程间数据块的传输。Spark中无论Jar包、文件还是闭包以及返回的结果都会使用Broadcast。目前的Broadcast支持两种方式,Torrent与HTTP。前者将会把数据切成小片,分布到集群中,有需要时从远程获取;后者将文件存入到本地磁盘,有需要时通过HTTP方式将整个文件传输到远端。前者稳定性优于后者,因此Torrent为默认的Broadcast方式。
参数 |
描述 |
默认值 |
---|---|---|
spark.broadcast.factory |
使用的广播方式。 |
org.apache.spark.broadcast.TorrentBroadcastFactory |
spark.broadcast.blockSize |
TorrentBroadcastFactory的块大小。该值过大会降低广播时的并行度(速度变慢),过小可能会影响BlockManager的性能。 |
4096 |
spark.broadcast.compress |
在发送广播变量之前是否压缩。建议压缩。 |
true |
- MapReduce服务_什么是ZooKeeper_如何使用ZooKeeper
- 申请企业邮箱_企业邮箱产品介绍参数配置
- 流水线参数使用
- GaussDB(DWS)常用SQL_常用SQL命令_SQL语法
- MapReduce服务_什么是存算分离_如何配置MRS集群存算分离
- GaussDB数据库参数调优_GaussDB版本_高斯数据库参数调优
- MapReduce服务_什么是MapReduce服务_什么是HBase
- Hudi服务_什么是Hudi_如何使用Hudi
- 文档数据库服务DDS参数模板管理_MongoDB参数管理_华为云
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用