网站大量收购独家精品文档,联系QQ:2885784924

数据仓库Hive应用实战 教案5-8课时_Hive简介.doc

数据仓库Hive应用实战 教案5-8课时_Hive简介.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

湖南汽车工程职业学院

教师授课教案

第1周第5-8课时累计8课时

课程名称

大数据仓库HIVE

授课课题

Hive简介

授课专业班级

大数据1801

教学目标

理解什么是Hive;

了解Hive的优缺点;

掌握Hive的系统架构;

理解Hive的工作原理;

理解Hive与传统数据库的区别;

教学要点

教学重点

虚拟机的安装及基础配置

教学难点

虚拟机的基础配置

课型

一体化授课

教法与学法(教具)

示范演示法、任务驱动教学法、分组合作教学法

课后作业

完成智课堂作业、看书复习

教学后记

(教师课后填写)

授课教师

王海霞

【课前复习】

1、以下不属于ApacheHadoop生态系统中的是()

A、Hive

B、HBase

C、Pig

D、Cascading

2、以下那个不是Hive发行版中附带的能进行编程访问的模块()

A、CLI

B、HWI

C、MapReduce

D、JDBC

3、如果你不是一名Java程序员,那就不能编写JavaMapreduce代码了,但是,如果你已经熟悉SQL,那学习Hive将会相当地容易,而且很多程序都能很容易且快速实现。()

【作业点评】

展示智课堂学生作业完成情况,并做点评。

【学习目标】

知识目标

理解什么是Hive;

了解Hive的优缺点;

掌握Hive的系统架构;

理解Hive的工作原理;

理解Hive与传统数据库的区别;

能力目标

能熟练绘制出Hive总体框图;

能熟练绘制出HiveServer2的架构图;

能阐述出Hive的工作原理。

【课程导入】

Hive的来历

【新课讲授】

一、什么是Hive

二、Hive的优缺点

1、Hive的优点

(1)简单容易上手:提供了类SQL查询语言HQL

(2)可扩展:为超大数据集设计了计算/扩展能力(MapReduce作为计算引擎,HDFS作为存储系统),一般情况下不需要重启服务Hive就可以自由的扩展集群的规模。

(3)提供统一的元数据管理

(4)延展性:Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数

(5)容错:良好的容错性,节点出现问题SQL仍可完成执行

2、Hive的缺点

(1)Hive的HQL表达能力有限。迭代式算法无法表达,如pagerank;数据挖掘方面不擅长,如kmeans。

(2)Hive的效率比较低。Hive自动生成的mapreduce作业,通常情况下不够智能化;Hive调优比较困难,粒度较粗;Hive可控性较差。

【互动答题】

1、以下描述中属于Hive优点的是()

A、简单容易上手:提供了SQL查询语言。

B、可扩展:为超大数据集设计了计算/扩展能力(MR作为计算引擎,HDFS作为存储系统),一般情况下不需要重启服务Hive可以自由的扩展集群的规模。

C、提供统一的元数据管理。

D、容错:良好的容错性,节点出现问题SQL仍可完成执行。

【新课讲授】

三、Hive的系统架构

1、Hive组件

2、HCatalog

3、HiveServer2

【互动答题】

1、以下不属于Hive组件的是()

A、HCatalog

B、HiveServer2

C、Hadoop

D、ThriftServer

【新课讲授】

Hive的工作原理

Hive与传统数据库区别

序号

对比项

Hive

MySQL

1

查询语言

HiveQL

SQL

2

数据存储位置

HDFS

块设备、本地文件系统

3

数据格式

用户定义

系统决定

4

数据更新

InsertOVERWRITE\INTOTABLE

(不建议更新)

UPDATE/INSERT/DELETE

支持

5

索引

不支持

支持

6

执行

多数查询由MapReduce执行

执行引擎执行

7

执行延迟

8

可扩展性

9

数据规模

【互动答题】

1、Hive与传统数据库MySQL相同之处是数据存储的位置均为本地文件系统。()

2、Hive和传统数据库一样,在加载数据时会对数据建立索引。()

【音频复习】

学生通过音频文件进行课堂复习

【课堂测验】

完成课堂测验题。

【课堂作业】

完成课堂作业

【总结】

学生总结本次课的内容。

【机房6S】

安排好学生的6S管理。

【课后作业】

完成课后作业。

您可能关注的文档

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档