Hadoop面试题及详细答案.docx

Hadoop面试题及详细答案

一、基础必考题(入门级,必问)

1.什么是Hadoop?它主要解决什么问题?

答案:Hadoop是一个开源的分布式计算框架,核心是解决“海量数据存储”和“海量数据分布式计算”两大问题,基于Java开发,适合处理PB级以上的大规模数据。

具体来说,它解决的痛点的是:传统单机存储和计算能力有限,无法处理TB、PB级别的大数据(比如电商的用户行为日志、互联网的海量文本数据),Hadoop通过分布式集群,将数据分散存储在多个节点,同时让多个节点并行计算,突破单机硬件限制,而且具备高容错性,单个节点故障不会影响整个集群运行。

补充:Hadoop核心由HDFS(存储)、M

文档评论(0)

1亿VIP精品文档

相关文档