Hadoop生态系统及开发 实训手册 实训11 数据操纵操作DML.docx

Hadoop生态系统及开发 实训手册 实训11 数据操纵操作DML.docx

实训5.3 数据操纵操作DML 1.实训目的 通过本实训,理解内部表与外部表的概念,理解表数据加载的四种方式与区别,理解DDL的概念以及实际操作。 2.实训内容 本实训通过创建内部表与外部表,并对其进行删除,对比操作结果来理解内部表与外部表的概念,并进行了其他的DML操作,最后操作数据加载与导出相关的四种操作。 3.实训要求 以小组为单元进行实训,每小组5人,小组自主协商选一位组长,由组长安排和分配实训任务。 4.准备知识 所需要具备的准备知识,主要是前面所学过的内容,此处一起回顾一下。 (1)内部表与外部表 ①概念 未被external修饰的是内部表,被external修饰的为外部表,默认情况下是内部表;? ②区别 内部表数据由Hive自身管理,外部表数据由HDFS管理; 删除内部表会直接删除元数据及存储数据; 删除外部表仅仅会删除元数据,HDFS上的文件并不会被删除; 5.实训步骤 (1)创建内部表 ①创建内部表 use test2; create table emp_managed as select * from emp; ②切换终端,查看表是否在HDFS的/myhive/mydb目录中(在实训5.2中emp表的路径为/myhive/mydb) hdfs dfs -ls /myhive/mydb 操作结果如图5-34所示。 图5-34 查询emp_managed表路

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档