2026年大数据工程师Hadop生态面试题及答案.docxVIP

  • 1
  • 0
  • 约3.53千字
  • 约 10页
  • 2026-02-10 发布于福建
  • 举报

2026年大数据工程师Hadop生态面试题及答案.docx

第PAGE页共NUMPAGES页

2026年大数据工程师Hadop生态面试题及答案

一、单选题(每题2分,共10题)

1.在Hadoop生态中,HDFS的NameNode负责管理什么?

A.数据块的位置信息

B.数据块的元数据

C.数据块的实际存储

D.次级NameNode的备份

答案:B

解析:NameNode是HDFS的主节点,负责管理文件系统的元数据,包括文件目录结构、文件块的位置信息等,但不直接管理数据块的实际存储。数据块由DataNode管理。

2.MapReduce框架中,Map阶段的输出格式是什么?

A.只有Key-Value对

B.只有Key

C.只有Value

D.可自定义格式

答案:A

解析:Map阶段的输出是Key-Value对,形式为IntermediateOutput,通常存储在内存中,超出内存后写入磁盘。

3.Hive中,以下哪个语句用于创建外部表?

A.`CREATETABLE`

B.`CREATEEXTERNALTABLE`

C.`CREATEDATABASE`

D.`CREATEVIEW`

答案:B

解析:外部表在创建时不占用其数据文件的空间,数据文件可以独立存在,适合已有数据的导入。

4.Spark中,RDD的持久化级别中,哪个是最节省内存但性能较低?

A.MemoryOnly

B.M

文档评论(0)

1亿VIP精品文档

相关文档