网站大量收购闲置独家精品文档,联系QQ:2885784924

《Hive数据仓库技术与应用案例教程》教案 项目4 Hive数据导入与导出.docx

《Hive数据仓库技术与应用案例教程》教案 项目4 Hive数据导入与导出.docx

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE2

PAGE2

PAGE15

PAGE15

课题

Hive数据导入与导出

课时

4课时(180min)

教学目标

知识目标:

(1)掌握导入数据的语法格式

(2)掌握导出数据的语法格式

技能目标:

(1)能够使用LOAD语句向表中加载数据

(2)能够使用INSERT语句向表中插入数据

(3)能够使用CREATE…AS语句创建表并导入数据

(4)能够使用IMPORT语句导入表

(5)能够使用INSERTOVERWRITE语句从表中导出数据

(6)能够使用EXPORT语句导出表

素养目标:

(1)培养举一反三的能力,学会融会贯通

(2)了解中国的数据库市场,紧跟时代发展

教学重难点

教学重点:数据导入的语法格式、数据导出的语法格式

教学难点:熟练运用导入数据和数据导出的语法格式

教学方法

案例分析法、问答法、讨论法、讲授法

教学用具

电脑、投影仪、多媒体课件、教材

教学过程

主要教学内容及步骤

课前任务

【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,完成课前任务

请大家了解Hive的数据导入与导出。

【学生】完成课前任务

考勤

【教师】使用APP进行签到

【学生】班干部报请假人员及原因

问题导入

【教师】提出以下问题:

(1)什么是数据导入?

(2)在Hive中,可以使用哪些语句进行数据导出?

【学生】思考、举手回答

传授新知

【教师】通过学生的回答引入要讲的知识,介绍数据导入和数据导出的相关知识

4.1数据导入

数据导入是指将数据源中的数据加载到数据仓库各表中的过程。在Hive中,可以使用LOAD、INSERT语句向已有的表中导入数据;也可以使用CREATE…AS语句在创建表时导入数据;还可以使用IMPORT语句导入表。

4.1.1LOAD加载数据

在Hive中,如果数据已经存储在本地文件系统或HDFS中,则可以使用LOAD语句将数据加载到Hive表中。LOAD加载数据的语法格式如下。

LOADDATA[LOCAL]INPATHfilepath[OVERWRITE]

INTOTABLE[database_name.]table_name

[PARTITION(partition_column=partition_col_value,…)];

上述语法格式的详细解释如下。

LOADDATA:加载数据的关键字。

LOCAL:可选项,表示从本地文件系统中加载数据。如果不使用LOCAL,则默认从HDFS中加载数据。

?【教师】随机邀请学生回答以下问题:

在远程模式下操作Hive时,本地文件系统是指什么?

?【学生】聆听、思考、回答

?【教师】总结学生的回答

在远程模式下操作Hive时,本地文件系统是指启动HiveServer2服务的服务端主机,而不是启动Beeline工具的客户端主机。

INPATHfilepath:用于指定要加载的数据的路径。其中,filepath可以是具体的文件路径,也可以是一个文件夹的路径。如果filepath指定的是一个文件夹的路径,则加载该文件夹中的所有文件。

OVERWRITE:可选项,表示加载数据时,会覆盖表或分区中已经存在的数据。如果不使用OVERWRITE,则默认使用追加的方式加载数据。

INTOTABLE[database_name.]table_name:用于指定要加载数据的表名。

PARTITION(partition_column=partition_col_value,…):可选项,用于将数据加载到分区表的指定分区。其中,partition_column表示分区字段;partition_col_value表示分区字段的值。

?【教师】利用多媒体展示“‘student_data’文件中的数据”图片(详见教材),并进行讲解

【例4-1】将Worker1主机中“/usr/local/hive/hive_data/student_data”文件中的数据(见图所示)加载到数据库hive_database的外部表external_table中。

(1)切换至数据库hive_database。

(2)执行如下语句,向外部表external_table中加载数据。

…/LOADDATALOCALINPATH/usr/local/hive/hive_data/student_data

OVERWRITEINTOTABLEexternal_table;

……(详见教材)

?【教师】随机邀请学生回答以下问题:

除了使用LOAD语句加载数据到外部表外,还可以使用什么方法加载数据?

?【学生】聆听、思考、回答

?【教师】总结学生的回答

实现例4-1之前,需要在Worker1主机的“/us

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档