用Apache Spark进行大数据处理——第一部分:入门介绍.pdfVIP

  • 2
  • 0
  • 约9.37千字
  • 约 11页
  • 2021-11-03 发布于江苏
  • 举报

用Apache Spark进行大数据处理——第一部分:入门介绍.pdf

用Apache Spark 进行大数据处理——第一部分:入门介 绍 什么是Spark Apache Spark 是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009 年由加州大学伯克利分校的AMPLab 开发,并于2010 年成为Apache 的开源项目之一。 与Hadoop 和Storm 等其他大数据和MapReduce 技术相比,Spark 有如下优势。 首先,Spark 为我们提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、 图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求。 Spark 可以将Hadoop 集群中的

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档