Spark基础介绍与技术栈概览.pdf

Spark‑day01

1.Spark初始

1.什么是Spark

ApacheSpark是专为大规模数据处理而设计的快速通用的计算引擎。

Spark是由加州大学伯克利分校的AMP开源的类Hadoop

MapReduce的通用并行计算框架。Spark拥有HadoopMapReduce的

所有优点;但与MapReduce不同的是,Spark可以将Job的中间输出结

果保存在内存中,从而避免了读写HDFS的过程,因此Spark更

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档