- 4
- 0
- 约8.08千字
- 约 9页
- 2026-05-18 发布于河北
- 举报
Hive数据面试题及详细答案
一、基础必考题(入门级,考察核心概念)
1.请说说Hive是什么?它和Hadoop的关系是什么?
答案:Hive是基于Hadoop的一个数据仓库工具,本质是将SQL语句转换为MapReduce(或Spark、Tez)任务来执行,它本身不存储数据,也不计算数据,核心作用是“用SQL操作Hadoop里的数据”,让不懂MapReduce的开发者也能通过SQL分析海量数据。
和Hadoop的关系:Hive依赖Hadoop,其中HDFS负责存储Hive的表数据,MapReduce/Spark负责执行Hive解析后的计算任务;简单说,Hadoop是底层的存储和计算框架,Hive是架在Hadoop之上的“SQL接口”,简化了海量数据的分析操作。
2.Hive中的数据库(Database)和表(Table),本质对应HDFS上的什么?
答案:核心是“目录结构”,所有Hive的元数据(库、表、字段、分区信息等)都存在元数据库(默认derby,生产常用MySQL)中,实际数据存在HDFS上:
1.数据库(Database):对应HDFS上的一个一级目录,默认路径是hive.metastore.warehouse.dir(配置项)下,比如默认路径是/user/hive/warehouse,那么数据库db1对应的路径就是/user/hive/warehouse/db1
您可能关注的文档
- EJB试题及详细答案.docx
- ELTiS试题及详细答案(贴合2.0机考版本).docx
- EMBA笔试题及详细答案.docx
- EMBA笔试题库及详细答案.docx
- EMBA面试题及详细答案.docx
- EMBA综合能力测试题及详细答案.docx
- EMC存储面试题及详细答案.docx
- EMS试题及详细答案.docx
- EPT试题及详细答案.docx
- EQ(情商)面试题及详细答案.docx
- 2025四川甘孜小升初数学基础真题卷苏教版考试题及答案.doc
- 体育场馆机械设备故障诊断方法研究异常分析.docx
- 2026年品牌形象代言合同协议.docx
- CN119625544A 一种森林生物量变化监测方法及系统 (安徽农业大学).docx
- 2025四川小升初数学拔高试卷苏教版试题及答案.doc
- 体育场馆机械设备故障诊断方法研究数据采集.docx
- 2026贵州罗甸小升初数学综合巩固卷人教版试题及答案.doc
- 工业自动化设备维护合同协议2026.docx
- CN119625510A 一种焊接电弧图像采集处理系统及方法 (浙江机电职业技术大学).docx
- 工程机械操作合同2026年安全规范.docx
最近下载
- 枣庄一中自招试卷真题及答案.doc VIP
- 2025年高考地理广西卷试题真题及答案详解(精校打印版).pdf VIP
- 2024年大学试题(大学选修课)-二十四史名篇导读(一)考试近5年真题荟萃附答案.docx VIP
- 意识障碍分级PPT课件.pptx VIP
- 混凝土结构课程设计.doc VIP
- 2024年大学试题(大学选修课)-二十四史名篇导读(一)历年考试高频考点试题附带答案.docx VIP
- 中国青铜艺术.pptx VIP
- 2019-2020学年重庆市北碚区八下期末英语试卷.docx VIP
- DB11T 751-2025 住宅物业服务标准.docx VIP
- 2025年5月11日福建省事业单位招聘考试《综合基础知识》笔试试题.docx VIP
原创力文档

文档评论(0)