- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
CDH4.1实战系列 上节课补充 Jps命令 Hive体系结构 Hive体系结构 ?用户接口,包括 CLI(hive shell),JDBC/ODBC,WebUI ?元数据存储,通常是存储在关系数据库如 mysql, derby 中 ?解释器、编译器、优化器、执行器 ?Hadoop:用 HDFS 进行存储,利用 MapReduce 进行计算 组件的基本功能 ?用户接口主要有三个:CLI,JDBC/ODBC和 WebUI ?CLI,即hive Shell命令行 ?JDBC/ODBC 是 Hive 的JAVA,与使用传统数据库JDBC的方式类似 ?WebGUI是通过浏览器访问 Hive Hive体系结构 ?Hive 将元数据存储在数据库中,如mysql、derby等 元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等 ?解释器、编译器、优化器完成 HQL(hive的sql) 查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在 HDFS 中,并在随后有 MapReduce 调用执行 ?Hive 的数据存储在 HDFS 中,大部分的查询由 MapReduce 完成(包含 * 的查询,比如 select * from table 不会生成 MapRedcue 任务) Metastore元数据 ?Metastore Hive表的元数据信息 ?Metastore包含如下的部分: ?Database 是表(table)的名字空间。默认的数据库(database)名为‘default’ ?Table 表(table)的原数据包含信息有:列(list of columns)和它们的类型(types),拥有者(owner),存储空间(storage)信息 ?Partition 每个分区(partition)都有自己的列(columns) Compiler ?Driver调用编译器(compiler)处理HiveQL字串,这些字串可能是一条DDL、DML或查询语句 ?编译器将字符串转化为策略(plan) ?策略仅由元数据操作和HDFS操作组成,元数据操作只包含DDL语句,HDFS操作只包含LOAD语句 ?对插入和查询而言,策略由map-reduce任务中的具有方向的非循环图(directedacyclic graph,DAG)组成 Hive运行模式? ?Hive的运行模式即任务的执行环境 ?分为本地与分布式两种 ?我们可以通过mapred.job.tracker 来指明 ?设置方式 ?hive SET mapred.job.tracker=local ; 欢迎访问我们的官方网站
文档评论(0)