- 3
- 0
- 约4.89千字
- 约 6页
- 2018-05-21 发布于天津
- 举报
Apache Spark 2.3 重要特性介绍
Spark大数据博客 -
Apache Spark 2.3 重要特性介绍
本文翻译自:Introducing Apache Spark 2.3
为了继续实现 Spark 更快,更轻松,更智能的目标,Spark 2.3
在许多模块都做了重要的更新,比如 Structured Streaming
引入了低延迟的连续处理(continuous processing);支持 stream-to-stream joins;通过改善
pandas UDFs 的性能来提升 PySpark;支持第四种调度引擎 Kubernetes clusters(其他三种分别
是自带的独立模式Standalone,YARN、Mesos)。除了这些比较具有里程碑的重要功能外,Spar
k 2.3 还有以下几个重要的更新:
引入 DataSource v2 APIs [SPARK-15689, SPARK-20928]
矢量化(Vectorized)的 ORC reader [SPARK-16060]
Spark History Server v2 with K-V store [SPARK
您可能关注的文档
最近下载
- 土木工程厂房课程设计.doc VIP
- 园林植物栽培与养护 第2版 项目二 园林植物保护地栽培技术.pptx VIP
- 园林专插本胡长龙版本园林规划设计复习提纲.doc
- 第四单元 第7课时 面积的变化(课件)六年级数学下册 苏教版.pptx VIP
- 2026年黑龙江省中考适应性考试化学试题(含答案解析).doc VIP
- GB50202-2002建筑地基基础工程施工质量验收规范.doc VIP
- 《人在囧途之泰囧》 剧本.pdf VIP
- 焊接与热切割练习题及答案.docx VIP
- 园林规划设计(胡长龙)期末终极复习资料.pdf VIP
- T_CNAS 42-2024 成人脑室外引流护理.docx VIP
原创力文档

文档评论(0)