大数据应用技术基础3.2.2Hive的数据模型.pptVIP

  • 0
  • 0
  • 约1.26千字
  • 约 18页
  • 2026-01-13 发布于陕西
  • 举报

大数据应用技术基础3.2.2Hive的数据模型.ppt

*新课导入学习目标新课教学学习评价课堂小结拓展训练认识Hive的数据模型1.交流介绍数据模型在数据管理及应用中的地位和作用?2.请你思考数据和数据模型的关系?知识:1.能说出Hive数据模型及作用;2.能比较Hive数据模型与SQL数据模型;3.能描述Hive数据表的用途;4.能描述Hive的数据文件。技能:1.能选择需要的Hive数据表类型;2.能说明Hive数据文件的优劣。活动1:认识Hive的数据模型1.Hive的数据模型Hive的数据模型相当于SQL数据库的逻辑数据模型用于描述Hive表的结构。Hive表也是由逻辑行、列组成的,但与数据是分享的,数据存储在HDFS文件系统中2.Hive的数据表(1)内部表由Hive管理的表,也称为管理表。内部表与数据紧密相关。对应HDFS系统中的一个目录。内部表一般用于处理仅需临时存储的数据。(2)自动实现Master/Master之间的切换2.Hive的数据表(1)内部表由Hive管理的表,也称为管理表。内部表与数据紧密相关。对应HDFS系统中的一个目录。内部表一般用于处理仅需临时存储的数据。(2)外部表外部表的数据不由Hive管理,它们可以存储在HDFS中的任何目录中。当删除外部表时,只是删除了外部表的定义,而不会把数据从HDFS系统中删除。类似SQL数据库中的外模式。(3)分区表在Hive中可以根据某一列(字段)的值将表分成若干子表(对应目录),这样的子表就是分区表。静态分区表和动态分区表。分区表可提高查询效率。(4)桶表桶是一种特殊的分区(对应数据文件),表或分区中的数据在Hash函数控制下进一步分成桶。(5)视图视图又称为虚表,在视图中查询的数据要从相关的基数据表中来。视图可以跨多个表建立。视图的主要用途是简化复杂查询任务。活动2:认识Hive数据文件1.行式存储文件(1)文本文件(2)序列化文件(3)Avro文件2.列式存储文件(1)ORC文件(2)Parquet文件ZooKeeper服务体系架构由组成。ZooKeeper的数据存储采用方式。ZooKeeper的数据有四种形式,它们的特点分别是。1.Hive表格式有。2.Hive数据文件格式有。3.Hive默认数据文件是格式,从数据分析效能来看应选择格式的数据文件。1.Hive数据模型及作用;2.Hive数据表的用途;3.Hive的数据文件。*新课导入学习目标新课教学学习评价课堂小结拓展训练**

文档评论(0)

1亿VIP精品文档

相关文档