MAPREDUCE服务 MRS-Spark2x基本原理:简介

时间：2024-10-21 15:11:43

MAPREDUCE服务 MRS Spark2x

简介

Spark是基于内存的分布式计算框架。在迭代计算的场景下，数据处理过程中的数据可以存储在内存中，提供了比MapReduce高10到100倍的计算能力。Spark可以使用HDFS作为底层存储，使用户能够快速地从MapReduce切换到Spark计算平台上去。Spark提供一站式数据分析能力，包括小批量流式处理、离线批处理、SQL查询、数据挖掘等，用户可以在同一个应用中无缝结合使用这些能力。Spark2x的开源新特性请参考Spark2x开源新特性说明。

Spark的特点如下：

上一篇：MAPREDUCE服务 MRS-Spark2x基本原理:结构

下一篇：MAPREDUCE服务 MRS-Spark2x基本原理:结构