Hive数据仓库工具架构与应用.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

1.02_01_01_01通过实际项目分析引出Hive及Hive、Hive前景如何

1.02_01_01_02Hive架构、优点及使用场景讲解

1.02_01_01_03Hive安装使用准备工作网页

回顾:Hive

HDFS管理

YARN

MapReduce处

理数据

日志:日志内容,统一的规范*每一

行数据就是一条数据(RDBMS)*很多列,

统一的标识符,进行分割Schema模式

约束Hive**在HDFS中处理的数据存

储**分析数据底层的实现是

MapReduce**执行程序运行的

YARNRDBMS表的概念

@@MapReduce编程的不便性##

MapReduce很难编程

##没有Schema,缺乏查询语言,例如SQL数据分析,

针对DBA,SQL语句,如何对数据分析。

MapReduce编程成本高实现并开源Hive。

@@什么是蜂巢

##Hive是基于Hadoop的一个数据仓库工具,可以将重构的数据文件映射成

一张表,并类SQL查询功能。

1.02_01_01_01通过实际项目分析引出Hive及Hive、Hive前景如何

1.02_01_01_02Hive架构、优点及使用场景讲解

1.02_01_01_03Hive安装使用准备工作网页

回顾:

Hive

HDFS

管理

YARN

MapReduce

处理数据

日志:

日志内容,统一的规范

*每一行数据就是一条数据(RDBMS)

*很多列,统一的标识符,进行分割

Schema

模式

约束

Hive

**处理的数据在HDFS

**分析数据底层的实现是MapReduce

**执行程序运行的YARN

RDBMS

表的概念

@@MapReduce编程的不便性

##MapReduceishardtoprogram

##NoSchema,lackofquerylanguage,eg.SQL

数据分析,针对DBA,SQL语句,如何对数据分析。

MapReduce编程成本高

实现并开源Hive。

@@什么是Hive

##Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射

成一张表,并类SQL查询功能。

##在Hadoop上构建数据仓库使用

HQL作为查询接口使用HDFS;使

用MapReduce计算##本质是:将HQL转

换成MapReduce程序

##HQL的是Engine。

@@Hive架构(面试中非常重要)

(1):

##用户接口:客户端

cli(hiveshell),JDBC/ODBC(javaHive),Webui(浏览器hive)

##元数据:Metastore

元数据包括:表名、表所属的数据库(默认为默认)、表的拥有者、

列、分区字段、表的类型(是否是外部表)、表的数据所在的目录等;

默认在自带的derby数据库中,推荐采用mysql。

##Hadoop:使用HDFS进行,使用MapReduce进行计算。

(2):##驱动器:Driver包含:解释器、

编译器、优化器、执行器解释器:

编译器:优化器:执行器:

@@Hive优点及其使用场景

1.02_01_01_04Hive安装配置及简单的测试网页

1.02_01_01_05Hive初步使用和安装MySQ网页

##构建在Hadoop上的数据仓库

使用HQL作为查询接口

使用HDFS;

使用MapReduce计算

##本质是:将HQL转换成MapReduce程序

##HQL的是Engine。

@@Hive架构(面试中非常

文档评论(0)

四季豆 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档