Hive工作原理和基本使用.ppt

下载文档 降价啦

22
0
约1.17千字
约 9页
2019-07-19 发布于山东
举报
版权申诉
保障服务

Hive工作原理和基本使用.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

CDH4.1实战系列上节课补充 Jps命令 Hive体系结构 Hive体系结构 ?用户接口，包括 CLI（hive shell），JDBC/ODBC，WebUI ?元数据存储，通常是存储在关系数据库如 mysql, derby 中 ?解释器、编译器、优化器、执行器 ?Hadoop：用 HDFS 进行存储，利用 MapReduce 进行计算组件的基本功能 ?用户接口主要有三个：CLI，JDBC/ODBC和 WebUI ?CLI，即hive Shell命令行 ?JDBC/ODBC 是 Hive 的JAVA，与使用传统数据库JDBC的方式类似 ?WebGUI是通过浏览器访问 Hive Hive体系结构 ?Hive 将元数据存储在数据库中，如mysql、derby等元数据包括表的名字，表的列和分区及其属性，表的属性（是否为外部表等），表的数据所在目录等 ?解释器、编译器、优化器完成 HQL（hive的sql）查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在 HDFS 中，并在随后有 MapReduce 调用执行 ?Hive 的数据存储在 HDFS 中，大部分的查询由 MapReduce 完成（包含 * 的查询，比如 select * from table 不会生成 MapRedcue 任务） Metastore元数据 ?Metastore Hive表的元数据信息 ?Metastore包含如下的部分： ?Database 是表（table）的名字空间。默认的数据库（database）名为‘default’ ?Table 表（table）的原数据包含信息有：列（list of columns）和它们的类型（types），拥有者（owner），存储空间（storage）信息 ?Partition 每个分区（partition）都有自己的列（columns） Compiler ?Driver调用编译器（compiler）处理HiveQL字串，这些字串可能是一条DDL、DML或查询语句 ?编译器将字符串转化为策略（plan） ?策略仅由元数据操作和HDFS操作组成，元数据操作只包含DDL语句，HDFS操作只包含LOAD语句 ?对插入和查询而言，策略由map-reduce任务中的具有方向的非循环图（directedacyclic graph，DAG）组成 Hive运行模式? ?Hive的运行模式即任务的执行环境 ?分为本地与分布式两种 ?我们可以通过mapred.job.tracker 来指明 ?设置方式 ?hive SET mapred.job.tracker=local ; 欢迎访问我们的官方网站