- 1
- 0
- 约1.16万字
- 约 11页
- 2026-05-19 发布于河北
- 举报
Hadoop面试题目及详细答案
一、基础概念题(入门必问,考察基础掌握度)
1.请说说你对Hadoop的理解,它主要解决什么问题?
答案:Hadoop不是一个单一工具,而是一个分布式计算和存储的开源框架,核心解决两个核心问题:一是海量数据的存储(比如TB、PB级数据),二是海量数据的并行计算。
举个实际场景:比如互联网公司每天产生的用户行为日志(浏览、点击、下单),数据量极大,单机存储存不下、单机计算算得慢,Hadoop就通过分布式集群,把数据分散到多台机器存储,同时让多台机器并行计算,提升处理效率,而且具备高容错性——某台机器挂了,数据和计算任务会自动切换到其他机器,不影响整体任务。
核心组件就是HDFS(存储)和MapReduce(计算),后来又衍生出YARN(资源调度),构成Hadoop的核心三大件。
2.HDFS的核心架构是什么?各个组件的作用是什么?
答案:HDFS采用主从(Master/Slave)架构,核心有三个组件:NameNode、DataNode、SecondaryNameNode,三者各司其职,没有单点故障(除了默认NameNode单点,实际生产会做高可用)。
1.NameNode(主节点):相当于HDFS的“大脑”,不存储实际数据,只存储元数据——比如文件的路径、文件名、每个文件对应的数据块存在哪些DataNode上、数据块的副本数等。它负责接收客户
您可能关注的文档
最近下载
- 政府采购案例分析解析.ppt VIP
- 重庆市西南大附属中学2023-2024学年英语八下期末学业质量监测试题含答案.doc VIP
- 铁路客服信息工程施工工艺规范汇编-V1.0.docx VIP
- 10 铁路建设工程监理规范.ppt VIP
- 年研发2.6万千瓦铝-空气金属燃料电池项目可行性报告.doc VIP
- GB∕T 3655-2022 用爱泼斯坦方圈测量电工钢带(片)磁性能的方法.pdf
- ASME B30.10中文版-缆索、起重机、桅杆、提升机、吊钩、起重器、吊索的安全标准.doc VIP
- (2023)精麻药品培训考试题库附含答案 .pdf VIP
- 电信智能云服务交付工程师(网大版)备考试题库大全(附答案).doc VIP
- 安徽省马鞍山市2022-2023学年高一下学期期末考试化学试题原卷版+解析版.docx VIP
原创力文档

文档评论(0)