Drill技术分享.pptxVIP

  • 194
  • 0
  • 约9.7千字
  • 约 31页
  • 2016-11-29 发布于重庆
  • 举报
Drill技术分享

Apache Drill大数据处理部—王维成都数联铭品2015.06.15第一篇:Apache Drill概述第二篇:Apache Drill优势第三篇:Apache Drill架构第四篇:Apache Drill原理第五篇:Apache Drill应用第六篇:Apache Drill性能第七篇:Apache Drill其他第一篇:概述Apache Drill是一个低延迟的分布式海量数据(涵盖结构化、半结构化以及嵌套数据)交互式查询引擎,使用ANSI SQL兼容语法,支持本地文件、HDFS、Hive、HBase、MongoDB等后端存储,支持Parquet、JSON、CSV、TSV、PSV等数据格式。受Google的Dremel启发,Drill满足上千节点的PB级别数据的交互式商业智能分析场景。本质上,Apache Drill是Google Dremel的开源实现,本质是一个分布式的mpp(大规模并行处理)查询层,支持SQL及一些用于NoSQL和Hadoop数据存储系统上的语言,将有助于Hadoop用户实现更快查询海量数据集的目的。Drill的目的在于支持更广泛的数据源、数据格式及查询语言,可以通过对PB字节数据的快速扫描(大约几秒内)完成相关分析,将是一个专为互动分析大型数据集的分布式系统。Google Dremel设计思想随着Hadoop的流行,大规模的数据分析系统已经越来越普

文档评论(0)

1亿VIP精品文档

相关文档