基于spark我们做了什么.pptVIP

下载本文档

111
0
约2.4千字
约 24页
2017-10-30 发布于天津
举报

基于spark我们做了什么.ppt

基于spark我们做了什么

基于Spark构建即席查询平台自我介绍基础架构部分布式计算团队孙垚光 09年-11年：Linux内核网络协议栈优化 11年-今：分布式计算批处理/内存计算/流式等目录即席查询为什么是Spark 基于Spark，我们做了什么应用案例后续规划即席查询面向“人”的查询即席（Ad-Hoc）：查询模式相对不固定数据没有（时间/成本）做过多预处理数据暂时不知如何处理交互式（Interactive）查询具有较高时效性为什么是Spark MPP vs Hadoop MPP(Impala) Hadoop(Hive/SparkSQL) 扩展性 1000台以内/PB以下千台以上/PB以上查询延迟毫秒~秒秒~分钟架构复杂性中等复杂容错无有调度策略 Gang/Transaction 分批调度与存储结合程度紧密一般基于Spark我们做了什么更易用更稳定安全/资源隔离性能/时效性整体架构基于Spark我们做了什么更易用 Platform as a Service 用户不再关心部署/升级/调参/监控各种形式的API Web/CLI/JDBC/SDK/Tools等合理/简洁的概念抽象 Resource/Project/Dataset/Table/Partition 账单 Query粒度的资源消耗基于Spark我们做了什么

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于spark我们做了什么.pptVIP