- 2
- 0
- 约小于1千字
- 约 11页
- 2026-05-20 发布于陕西
- 举报
Spark简介
Spark基本概念与特点
Spark生态系统及未来发展趋势
目录
Spark基本概念与特点
01
Spark定义及发展历程
发展史
2009年由加州大学伯克利分校的AMP实验室开源
2014年2月,Spark成为Apache的顶级项目
2017年7月,Spark2.2.0发布,系统的可用性、稳定性更加出色
大规模分布式通用计算引擎
SparkCore:核心计算框架
SparkSQL:结构化数据查询
SparkStreaming:实时流处理
SparkMLib:机器学习
SparkGraphX:图计算
基本特征
速度快
ApacheSpark使用最先进的DAG调度程序、查询优化器和物理执行引擎,实现批处理和流处理的高性能运行。
易于使用
Spark提供80多个高级操作,可以轻松构建并行应用程序。支持使用Scala,Python,R和SQLshell以交互方式使用它。
基本特征
通用
Spark支持很多库,包括SparkSQL、用于机器学习的MLlib、处理图计算的GraphX和流处理SparkStreaming。可以在同一个应用程序中无缝地组合这些库。
多种运行模式
可以在Standalone集群、EC2、HadoopYARN、Mesos上或在Kubernetes上运行Spark。并且支持访问HDFS,Alluxio,ApacheCassand
您可能关注的文档
- WMS系统信息化集成WMS系统集成化设计24课件讲解.pptx
- WMS系统信息化集成库位管理43课件讲解.pptx
- WMS系统信息化集成物料盘点40课件讲解.pptx
- Photoshop工作界面一Photoshop2022入门94课件讲解.pptx
- PLC的数据类型介绍49课件讲解.pptx
- PowerBIDAX表达式解锁数据的魔法棒91课件讲解.pptx
- PowerBI的功能与使用39课件讲解.pptx
- PowerBI交互式报表设计让数据动起来27课件讲解.pptx
- Python操作MySQL69课件讲解.pptx
- Python的超级计算器40课件讲解.pptx
- (正式版)DB4403∕T 324-2023 《农药包装废弃物回收指南》.pdf
- (正式版)DB45∕T 2720-2023 《轻质泡沫混凝土设计与施工规范》.pdf
- (正式版)DB44∕T 1047-2012 《物业服务 清洁检查规范》.pdf
- (正式版)DB44∕T 1083-2012 《高速铁路通信覆盖工程施工监理规范》.pdf
- (正式版)DB44∕T 2103-2018 《五轴钻铣复合机床 技术条件》.pdf
- CN120278434A 智能电网电力调度优化方法 (江苏智慧工场技术研究院有限公司).pdf
- 飞利浦半导体BT152系列晶闸管技术规格与应用概述.pdf
- CN120266742A 一种山地光伏发电灌溉及精准喷洒清洗运维系统及方法 (中国电建集团贵阳勘测设计研究院有限公司).pdf
- (正式版)DB44∕T 2099.1-2018 《电动汽车无线充电系统 第1部分:通用要求》.pdf
- (正式版)DB44∕T 1051-2012 《现场招聘会服务规范》.pdf
原创力文档

文档评论(0)