- 2
- 0
- 约9.37千字
- 约 11页
- 2021-11-03 发布于江苏
- 举报
用Apache Spark 进行大数据处理——第一部分:入门介
绍
什么是Spark
Apache Spark 是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009
年由加州大学伯克利分校的AMPLab 开发,并于2010 年成为Apache 的开源项目之一。
与Hadoop 和Storm 等其他大数据和MapReduce 技术相比,Spark 有如下优势。
首先,Spark 为我们提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、
图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求。
Spark 可以将Hadoop 集群中的
您可能关注的文档
- 生物:北京市延庆县第四中学《10.2无性生殖》学案(八年级上).pdf
- 生物:专题6课题2胡萝卜素的提取每课一练(人教版选修1).pdf
- 生物:北京市延庆县第四中学《13.3人类的遗传》学案一(八年级上).pdf
- 生物:山东省临沭县第三初级中学第二单元《没有细胞结构的微小生物--病毒》教案(人教版七年级上).pdf
- 生物:山东省临沭县第三初级中学第五单元《先天性行为和学习行为》教案(人教版八年级上).pdf
- 生物:山东省临沭县第三初级中学第五单元《细菌真菌在自界的作用》教案(人教版八年级上).pdf
- 生物:山东省临沭县第三初级中学第六单元《尝试对生物进行分类》教案一(人教版八年级上).pdf
- 生物:山东省临沭县第三初级中学第五单元《陆地生活的动物》教案二(人教版八年级上).pdf
- 生物:山东省高密市银鹰文昌中学细胞的结构和功能1 学案(七年级上).pdf
- 生物:山东省高密市银鹰文昌中学绿色植物的光合作用二 学案(七年级上).pdf
原创力文档

文档评论(0)