Hive面试题及详细答案.docxVIP

  • 2
  • 0
  • 约1.04万字
  • 约 12页
  • 2026-05-19 发布于河北
  • 举报

Hive面试题及详细答案

一、基础概念题(入门必问,考察基础掌握度)

1.请说说Hive是什么?它和Hadoop的关系是什么?

答案:Hive是基于Hadoop的一个数据仓库工具,不是数据库,它本身不存储数据,也不负责计算,核心是将SQL语句转换成MapReduce(或Tez、Spark)任务,依托Hadoop的HDFS存储数据、MapReduce/Tez/Spark执行计算,实现对海量结构化、半结构化数据的离线分析。

简单说:Hive是“翻译官”,把SQL翻译成分布式计算任务;Hadoop是“底层算力和存储载体”,Hive依赖Hadoop才能工作,没有Hadoop,Hive无法运行。

易错点:很多人会把Hive当成数据库,要明确Hive不支持实时查询(原生)、不支持事务(默认不支持,需开启特定配置),主打离线批量分析。

2.Hive中的数据库(Database)和表(Table),本质是什么?和HDFS的对应关系是什么?

答案:Hive的数据库和表,本质都是HDFS上的目录,元数据(表结构、字段类型、存储位置等)存在元数据库(默认Derby,生产常用MySQL)中。

对应关系:

数据库(Database):对应HDFS上的一个一级目录,默认路径是hive.metastore.warehouse.dir(默认/user/hive/warehouse)下,比如数据库db_tes

文档评论(0)

1亿VIP精品文档

相关文档