- 194
- 0
- 约9.7千字
- 约 31页
- 2016-11-29 发布于重庆
- 举报
Drill技术分享
Apache Drill大数据处理部—王维成都数联铭品2015.06.15第一篇:Apache Drill概述第二篇:Apache Drill优势第三篇:Apache Drill架构第四篇:Apache Drill原理第五篇:Apache Drill应用第六篇:Apache Drill性能第七篇:Apache Drill其他第一篇:概述Apache Drill是一个低延迟的分布式海量数据(涵盖结构化、半结构化以及嵌套数据)交互式查询引擎,使用ANSI SQL兼容语法,支持本地文件、HDFS、Hive、HBase、MongoDB等后端存储,支持Parquet、JSON、CSV、TSV、PSV等数据格式。受Google的Dremel启发,Drill满足上千节点的PB级别数据的交互式商业智能分析场景。本质上,Apache Drill是Google Dremel的开源实现,本质是一个分布式的mpp(大规模并行处理)查询层,支持SQL及一些用于NoSQL和Hadoop数据存储系统上的语言,将有助于Hadoop用户实现更快查询海量数据集的目的。Drill的目的在于支持更广泛的数据源、数据格式及查询语言,可以通过对PB字节数据的快速扫描(大约几秒内)完成相关分析,将是一个专为互动分析大型数据集的分布式系统。Google Dremel设计思想随着Hadoop的流行,大规模的数据分析系统已经越来越普
原创力文档

文档评论(0)