MAPREDUCE服务 MRS-Spark2x与其他组件的关系:Spark和HDFS的关系

时间：2024-04-01 09:39:26

MAPREDUCE服务 MRS

通常，Spark中计算的数据可以来自多个数据源，如Local File、HDFS等。最常用的是HDFS，用户可以一次读取大规模的数据进行并行计算。在计算完成后，也可以将数据存储到HDFS。

分解来看，Spark分成控制端(Driver)和执行端（Executor）。控制端负责任务调度，执行端负责任务执行。

读取文件的过程如图1所示。

图1 读取文件过程

读取文件步骤的详细描述如下所示：

写入文件的过程如图2所示。

图2 写入文件过程

HDFS文件写入的详细步骤如下所示：

新客秒杀 2核2G 3M L实例

68元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

MAPREDUCE服务 MRS-Spark2x与其他组件的关系:Spark和HDFS的关系

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

7*24