- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
引言Hive是基于Hadoop的一个/view/19711.htm数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,Hive在Hadoop之上提供了数据查询的能力,主要解决非关系型数据查询问题。本章通过对Hive的概述、Hive的架构、Hive Shell命令、Hive API操作的讲解,让学生深刻理解和运用Hive系统。Hive简介Hive 本身是建立在 Hadoop体系结构上的数据仓库基础构架,可以将结构化的数据文件映射为一张数据库表,并提供完整的QL语句,把QL语句转化成MapReduce程序提交给Hadoop集群完成相关任务。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL ),这是一种可以存储、查询和分析并存储在 Hadoop中的大规模数据处理的机制。Hive 定义了简单的类 SQL 查询语言,称为 QL ,熟悉 SQL 的用户都可以进行查询数据。同时,这个语言也允许熟悉 MapReduce开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer以满足无法完成的复杂的分析工作。Hive数据类型Hive具有支持的数据类型,主要分为两种:基本数类型和复杂数据类型,复杂数据类型也可以成为集合数据类型。(1)基本数据类型,主要分为4类,如下tinyint/smallint/int/bigintfloat/doublebooleanstringHive数据类型(2)复杂数据类型,主要分为3类,如下ArrayMapStruct注意:没有date/datetime类型Hive MetastoreMetastore是Hive元数据的集中存放地。Metastore默认使用内嵌的derby数据库作为存储引擎Derby引擎的缺点:一次只能打开一个会话使用MySQL作为外置存储引擎,多用户同时访问 Metastore用来存储hive的元数据信息,默认情况下是和hive绑定的,部署在同一个JVM中,将元数据存储到derby中。使用内嵌数据库没有办法为hive开启多个实例。如果Hive配置成MySQL数据库,可以将数据独立出来在多个实例之间共享。Hive存储和压缩首先,Hive 没有专门的数据存储格式,也没有为数据建立索引,用户可以非常自由的组织 Hive 中的表,只需要在创建表的时候告诉 Hive 数据中的列分隔符和行分隔符,Hive 就可以解析数据。 其次,Hive 中所有的数据都存储在 HDFS 中,Hive 中包含以下数据模型:Table,External Table,Partition,Bucket。Hive与传统数据库对比 Hive作为大数据环境下的数据仓库工具,和传统的数据库虽然有很多相似之处,但是还是有很多不同之处,在传统的数据库中,表的模式是在数据加载的时候强行确定好的,而Hive在加载的过程中不对数据进行任何验证操作,加载过程比传统数据库快一些,具体其他不同之处。Hive与传统数据库对比查询语言HiveQLSQL数据存储位置HDFSRaw Device or 本地FS数据格式用户定义系统决定数据更新不支持支持索引新版本有,但弱有执行MapReducerExecutor执行延迟高低可扩展性高低数据规模大小Hive系统架构 Hive的系统架构组成主要分四个部分:用户接口部分、存放元数据的数据库、解释器,编译器、存放数据的HDFS系统, Hive系统架构用户接口,包括CLI,JDBC/ODBC,WebUI。元数据存储,通常是存储在关系数据库如MySQL,DERBY中。解释器、编译器、优化器、执行器。Hadoop:用 HDFS 进行存储,利用 MapReduce 进行计算。用户接口主要有三个:CLI,JDBC/ODBC和 WebUIHive 将元数据存储在数据库中(Metastore),目前只支持 MYSQL、DERBY。Hive 中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等。解释器、编译器、优化器完成 HQL 查询语句从词法分析、语法分析、编译、优化以及查询计划(plan)的生成。生成的查询计划存储在 HDFS 中,并在随后有 MapReduce 调用执行。Hive 的数据存储在 HDFS 中,大部分的查询由 MapReduce 完成(包含 * 的查询,比如 select * from table 不会生成 MapReduce任务)。
您可能关注的文档
- Flash动画制作与应用 (8).ppt
- Flash动画制作与应用 (9).ppt
- Flash动画制作与应用 (10).ppt
- Flash动画制作与应用 (11).ppt
- Flash动画制作与应用 (12).ppt
- Flash动画制作与应用 (13).ppt
- Flash动画制作与应用 (14).ppt
- Flash动画制作与应用 (15).ppt
- Flash动画制作与应用 (16).ppt
- Flash动画制作与应用 (18).ppt
- Hadoop开发案例第10章 Hadoop数据采集Flume.pptx
- Hadoop开发案例第11章 OTA离线数据分析平台.pptx
- HTML 5移动平台的Java Web实用项目开发单元1 购物网站导航栏和信息提示设计(JSP).ppt
- HTML 5移动平台的Java Web实用项目开发单元2 购物网站访问量统计模块设计(JSP+Servlet).ppt
- HTML 5移动平台的Java Web实用项目开发单元3 购物网站商品展示与查询模块设计(JSP+Servlet+JDBC).ppt
- HTML 5移动平台的Java Web实用项目开发单元4 购物网站购物车模块设计(JSP+Servlet+JavaBean).ppt
- HTML 5移动平台的Java Web实用项目开发单元5 购物网站登录与注册模块设计(JSP+Model2).ppt
- HTML 5移动平台的Java Web实用项目开发单元6 购物网站喜爱商品投票统计模块设计(Struts2+JSTL+JFreeChart组件).ppt
- HTML 5移动平台的Java Web实用项目开发单元7 购物网站用户留言模块设计(JSP+Servlet+Hibernate).ppt
- HTML 5移动平台的Java Web实用项目开发单元8 购物网站订单模块设计和多模块集成(JSP+Struts 2+Spring+Hibernate).ppt
最近下载
- 人民版中华民族大家庭全册教学设计教案.doc
- 2020年江苏公务员考试《申论》真题(A类)及参考答案.pdf VIP
- 雷克萨斯-Lexus IS-产品使用说明书-IS300-ASE30L-AEZLZC-LEXUS雷克萨斯IS300OM53D87C_01-1705-00.pdf VIP
- 静配中心-高警示药品管理考核试题(附答案).docx VIP
- 静配中心-高警示药品管理考核试题.docx VIP
- 静配中心药品日常管理考核试题(+答案解析).docx VIP
- 静配中心药品日常管理考核试题及答案.docx VIP
- 静配中心业务知识考核试题题库及答案.docx VIP
- 人物细节描写课件.pptx VIP
- 精准医疗与传统治疗比较.docx VIP
文档评论(0)