- 76
- 0
- 约9.96千字
- 约 46页
- 2017-06-11 发布于湖北
- 举报
图片展示的实例: (1)利用put命令向表tempTalble,行r1,列f1:c1中插入数据 (2)利用scan命令浏览表tempTable的相关信息 * 图片展示的实例: (1)利用put命令向表tempTalble,行r1,列f1:c1中插入数据 (2)利用scan命令浏览表tempTable的相关信息 * 图片展示的实例: (1)利用put命令向表tempTalble,行r1,列f1:c1中插入数据 (2)利用scan命令浏览表tempTable的相关信息 * 14.3.2 Hive中SQL查询转换成MapReduce作业的过程 第1步:由Hive驱动模块中的编译器对用户输入的SQL语言进行词法和语法解析,将SQL语句转化为抽象语法树的形式 第2步:抽象语法树的结构仍很复杂,不方便直接翻译为MapReduce算法程序,因此,把抽象语法书转化为查询块 第3步:把查询块转换成逻辑查询计划,里面包含了许多逻辑操作符 第4步:重写逻辑查询计划,进行优化,合并多余操作,减少MapReduce任务数量 第5步:将逻辑操作符转换成需要执行的具体MapReduce任务 第6步:对生成的MapReduce任务进行优化,生成最终的MapReduce任务执行计划 第7步:由Hive驱动模块中的执行器,对最终的MapReduce任务进行执行输出 14.3.2 Hive中SQL查询转换成MapReduce作业的过程 当启动MapReduce程序时,Hive本身是不会生成MapReduce算法程序的 需要通过一个表示“Job执行计划”的XML文件驱动执行内置的、原生的Mapper和Reducer模块 Hive通过和JobTracker通信来初始化MapReduce任务,不必直接部署在JobTracker所在的管理节点上执行 通常在大型集群上,会有专门的网关机来部署Hive工具。网关机的作用主要是远程操作和管理节点上的JobTracker通信来执行任务 数据文件通常存储在HDFS上,HDFS由名称节点管理 几点说明: 14.4 Hive HA基本原理 图 Hive HA基本原理 问题:在实际应用中,Hive也暴露出不稳定的问题 解决方案:Hive HA(High Availability) 由多个Hive实例进行管理的,这些Hive实例被纳入到一个资源池中,并由HAProxy提供一个统一的对外接口 对于程序开发人员来说,可以把它认为是一台超强“Hive 14.5 Impala 14.5.1 Impala简介 14.5.2 Impala系统架构 14.5.3 Impala查询执行过程 14.5.4 Impala与Hive的比较 14.5.1 Impala简介 Impala是由Cloudera公司开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase上的PB级大数据,在性能上比Hive高出3~30倍 Impala的运行需要依赖于Hive的元数据 Impala是参照 Dremel系统进行设计的 Impala采用了与商用并行关系数据库类似的分布式查询引擎,可以直接与HDFS和HBase进行交互查询 Impala和Hive采用相同的SQL语法、ODBC驱动程序和用户接口 14.5.1 Impala简介 图 Impala与其他组件关系 14.5.2 Impala系统架构 图 Impala系统架构 Impala和Hive、HDFS、HBase等工具是统一部署在一个Hadoop平台上的 Impala主要由Impalad,State Store和CLI三部分组成 14.5.2 Impala系统架构 Impala主要由Impalad,State Store和CLI三部分组成 Impalad 负责协调客户端提交的查询的执行 包含Query Planner、Query Coordinator和Query Exec Engine三个模块 与HDFS的数据节点(HDFS DN)运行在同一节点上 给其他Impalad分配任务以及收集其他Impalad的执行结果进行汇总 Impalad也会执行其他Impalad给其分配的任务,主要就是对本地HDFS和HBase里的部分数据进行操作 14.5.2 Impala系统架构 2. State Store 会创建一个statestored进程 负责收集分布在集群中各个Impalad进程的资源信息,用于查询调度 CLI 给用户提供查询使用的命令行工具 还提供了Hue、JDBC及ODBC的使用接口 说明:Impala中的元数据直接存储在Hive中。Impala采用与Hive相同的元数据、SQL语法、ODBC驱动程序和用户接口,从而使得在一个Hadoop平台上,可以统一部署Hive和Impala等分
您可能关注的文档
- 半导体存储器选读.pdf
- 大柳塔煤矿新型工业化历程-20120322试卷.ppt
- 大气的热力作用试卷.ppt
- 半导体电子组件化镀生产线项目可研经信委备案用(通过版)选读.pdf
- 红星夜购方案选读.doc
- 半导体发光二极管芯片选读.pdf
- 胡万荣-电话服务技巧提升训练营【中华讲师网】选读.pptx
- 半导体封装测试综述选读.pdf
- 湖南省股权质押冻结登记业务指南选读.doc
- 财务管理第4章教案选读.doc
- 2025年北京市门头沟区中考一模英语试题.docx
- 2025年北京市门头沟区中考二模英语试题.docx
- 2025年北京市丰台区中考二模英语试题.docx
- 2025年中考英语考前冲刺模拟卷 (北京专用) 解析卷.docx
- 2025年中考英语考前冲刺模拟卷 (北京专用) 原卷.docx
- 2025年肩颈按摩仪行业社媒趋势数据分析.docx
- 2025年人身险行业信用回顾与2026年展望.docx
- 合同法买卖合同培训课件.ppt
- 2025年全球食物系统与SDG研究报告-食物供给、食者健康、生态平衡的整体治理.docx
- 2025下半年四川乐山市川投峨眉铁合金(集团)有限责任公司对考前自测高频考点模拟试题最新.docx
最近下载
- 2026高考化学疑难杂症:基元反应、速率方程.docx VIP
- ZONGSHEN宗申航发C100-F航空活塞发动机操作手册.pdf
- 2025中考数学压轴题每日一题(130题)答案.docx VIP
- 1209 五年级(上)英语知识点汇总《外研版》-9f2de7ee2968.docx VIP
- 1209 五年级(上)英语知识点汇总《外研版》.docx VIP
- 小学五年级体育下学期教案集.doc VIP
- 最新整理企业集中采购调研报告范文..docx VIP
- 1209 六年级(上)英语知识点汇总(外研版)-2d52fbea8388.docx VIP
- 光现象复习课件 .ppt VIP
- ICH-GCP中英文对照(完整)【参考】.doc VIP
原创力文档

文档评论(0)