实训5.3 数据操纵操作DML
1.实训目的
通过本实训,理解内部表与外部表的概念,理解表数据加载的四种方式与区别,理解DDL的概念以及实际操作。
2.实训内容
本实训通过创建内部表与外部表,并对其进行删除,对比操作结果来理解内部表与外部表的概念,并进行了其他的DML操作,最后操作数据加载与导出相关的四种操作。
3.实训要求
以小组为单元进行实训,每小组5人,小组自主协商选一位组长,由组长安排和分配实训任务。
4.准备知识
所需要具备的准备知识,主要是前面所学过的内容,此处一起回顾一下。
(1)内部表与外部表
①概念
未被external修饰的是内部表,被external修饰的为外部表,默认情况下是内部表;?
②区别
内部表数据由Hive自身管理,外部表数据由HDFS管理;
删除内部表会直接删除元数据及存储数据;
删除外部表仅仅会删除元数据,HDFS上的文件并不会被删除;
5.实训步骤
(1)创建内部表
①创建内部表
use test2;
create table emp_managed as select * from emp;
②切换终端,查看表是否在HDFS的/myhive/mydb目录中(在实训5.2中emp表的路径为/myhive/mydb)
hdfs dfs -ls /myhive/mydb
操作结果如图5-34所示。
图5-34 查询emp_managed表路
您可能关注的文档
- 《PCB设计与制作》(第二版) 课件 项目6 无线鼠标四层异形PCB设计.pptx
- 《PCB设计与制作》(第二版) 课件 项目7 单面和双面PCB的制作.pptx
- 《Hadoop大数据技术与应用》教学大纲.doc
- 《Hadoop大数据技术与应用》课程标准.docx
- Hadoop生态系统及开发 课件 第一章 大数据基础概述.pptx
- Hadoop生态系统及开发 实训手册 实训1 基础实训环境准备.docx
- Hadoop生态系统及开发 实训手册 实训2 HDFS的安装部署与配置.docx
- Hadoop生态系统及开发 实训手册 实训3 HDFS的读写API操作.docx
- 实训4 部署YARN集群.docx
- 实训5 单词计数.docx
- 四川省成都市嘉祥教育集团2024-2025学年七年级下学期期中数学试题(解析版).docx
- 四川省成都市青羊区石室联合中学2024-2025学年七年级下学期期中考试数学试题(解析版).pdf
- 四川省成都市青羊区石室联合中学2024-2025学年七年级下学期期中考试数学试题(解析版).docx
- 四川省成都市武侯区北京第二外国语学院成都附属中学2024-2025学年七年级下学期期中数学试题(解析版).docx
- 四川省成都市武侯区北京第二外国语学院成都附属中学2024-2025学年七年级下学期期中数学试题(解析版).pdf
- 四川省绵阳市涪城区2024-2025学年七年级下学期5月期中考试数学试题(解析版).pdf
- 四川省绵阳市涪城区2024-2025学年七年级下学期5月期中考试数学试题(解析版).docx
- 四川省绵阳市江油市2024-2025学年七年级下学期5月期中数学试题(解析版).pdf
- 四川省绵阳市江油市2024-2025学年七年级下学期5月期中数学试题(解析版).docx
- 四川省绵阳市游仙区2024-2025学年七年级下学期5月期中考试数学试题(解析版).docx
原创力文档

文档评论(0)