hive实践教程.docxVIP

下载本文档

24
0
约1.62万字
约 15页
2016-08-21 发布于天津
举报

hive实践教程.docx

hive实践教程

Hive实践教程1.Hive简介Hive是Facebook开发的构建于Hadoop集群之上的数据仓库应用，可以将结构化的数据文件映射为一张数据库表，并提供完整的sql查询功能，可以将sql语句转换为MapReduce 任务进行运行。Hive是一个可以提供有效的、合理的且直观的组织和使用数据的模型，即使对于经验丰富的Java开发工程师来说，将这些常见的数据运算对应到底层的MapReduce Java API也是令人敬畏的。Hive可以帮用户做这些工作，用户就可以集中精力关注查询本身了。Hive可以将大多数的查询转换为MapReduce任务。Hive最适合于数据仓库应用程序，使用该应用程序进行相关的静态数据分析，不需要快速响应给出结果，而且数据本身也不会频繁变化。Hive不是一个完整的数据库。Hadoop以及HDFS的设计本身约束和局限性限制了Hive所能胜任的工作。最大的限制就是Hive不支持记录级别的更新、插入或者删除。用户可以通过查询生成新表或将查询结果导入到文件中去。因为Hadoop是一个面向批处理的系统，而MapReduce启动任务启动过程需要消耗很长时间，所以Hive延时也比较长。Hive还不支持事务。因此Hive不支持联机事务处理（OLTP），更接近于一个联机分析技术（OLAP）工具，但是目前还没有满足”联机“部分。Hive提供了一系列的工具，可以用来进行数据提取转化加载

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

hive实践教程.docxVIP