Hive大数据面试题(含详细接地气答案).docx

Hive大数据面试题(含详细接地气答案).docx

Hive大数据面试题(含详细接地气答案)

一、Hive基础核心面试题

1、简单说下Hive是什么?优缺点是什么?

参考答案:

Hive是基于Hadoop的数据仓库工具,它可以把SQL语句转换成MapReduce、Tez、Spark任务运行,主要用来做离线大数据分析,不用写复杂的MR代码,会SQL就能处理海量数据。

优点:

1、上手简单,兼容标准SQL,学习成本低,适合数仓开发人员;

2、基于Hadoop,支持海量数据存储和计算,可横向扩容;

3、支持分区、分桶、多种文件格式,适合构建分层数据仓库;

4、不占用集群常驻资源,任务跑完就释放,资源利用率高。

缺点:

1、只适合离线计算,延迟高,

文档评论(0)

1亿VIP精品文档

相关文档