Spark User Beijing Meetup
Spark在百度大数据生态上的
应用与实践
汪凯百度基础架构部
2015年6月
一、Spark 在百度的发展历程
二、工程(产品)实践案例
Spark 在 百度的发展历程
Spark In Baidu
Spark 0.8-0.9 Spark 1.0 Spark 1.1 Spark 1.2
•正式引入百 •支持百度开 •支持内部数 •对接
度,创建内部 放云 据仓库系统 Normandy
代码分支 •第一个内部 •对内开放 •…
•支持内部 业务上线 SQL Service
HDFS •对接Tachyon
•支持内部数
据传输系统
兼容百度内部的 HDFS(PETA)集群
支持BIGPIPE 数据源,多一种流式计算选择
Spark In Baidu
Spark 0.8-0.9 Spark 1.0 Spark 1.1 Spark 1.2
•正式引入百 •支持百度开 •支持内部数 •对接
度,创建内部 放云 据仓库系统 Normandy
代码分支 •第一个内部 •对内开放 •…
•支持内部 业务上线 SQL Service
HDFS •对接Tachyon
•支持内部数
据传输系统
支持百度公有云产品BMR ,对外提供大数据计算服务
第一个内部业务上线
Spark In Baidu
Spark 0.8-0.9 Spark 1.0 Spark 1.1 Spark 1.2
•正式引入百 •支持百度开 •支持内部数 •对接
度,创建内部 放云 据仓库系统 Normandy
代码分支 •第一个内部 •对内开放 •…
•支持内部 业务上线 SQL Service
HDFS •对接Tachyon
•支持内部数
据传输系统
UDW 数据接入,Spark SQL 直接读写 UDW 表格
CloudQuery ,高速 UDW 查询引擎
整合Tachyon做透明Cache层
Spark In Baidu
Spark 0.8-0.9 Spark 1.0 Spark 1.1
您可能关注的文档
最近下载
- 心脑血管的危害和防治.ppt
- 上海2024年高考英语试卷.doc VIP
- 2026春新版人教版八年级下册单词默写单词表(全)U1-U8中译英.docx
- 07 王涛-教师资格-数学学科知识与教学能力(高中)-第三部分第五章至第八章(46-48讲).pdf VIP
- 《业财一体化实训教程-----金蝶云星空V7.5》.pptx VIP
- 2014广东粤西北事业单位考试真题及答案——通用类.doc VIP
- 基于PLC的运料小车自动控制设计研究.docx VIP
- ISO 9001(DIS)-2026《质量管理体系——要求》(含附录使用指南-中文版-译-2025年9月).docx VIP
- 《宋代点茶文化与艺术》全套教学课件.pptx
- 年产3000吨猕猴桃果汁工厂设计_毕业设计.doc VIP
原创力文档

文档评论(0)