大数据开发Hadoop题目及详解.docxVIP

  • 2
  • 0
  • 约1.11万字
  • 约 25页
  • 2026-06-23 发布于上海
  • 举报

大数据开发Hadoop题目及详解

一、单项选择题(共10题,每题1分,共10分)

以下选项中,不属于Hadoop2.x官方定义核心组件的是

A.HDFS分布式文件系统

B.MapReduce分布式计算框架

C.Spark流式处理引擎

D.YARN资源调度框架

答案:C

解析:Hadoop2.x的核心三大组件明确为HDFS、MapReduce、YARN,Spark属于Hadoop生态体系下的第三方计算组件,不属于Hadoop原生核心组件。选项A、B、D均是Hadoop核心组件,不符合题干要求。

Hadoop3.x版本中,HDFS默认的数据块大小为

A.32MB

B.64MB

C.128MB

D.256MB

答案:C

解析:Hadoop2.x及之后的主流版本默认HDFS块大小均为128MB,大尺寸块可以减少NameNode的元数据压力,同时降低块寻址的额外开销。选项A的32MB、B的64MB是早期低版本Hadoop的默认块大小,D的256MB是部分生产环境自定义调整的块大小,不是默认配置。

MapReduce分布式计算框架中,Shuffle阶段的核心作用是

A.把Map任务的输出数据按照规则分组排序后传递给Reduce任务

B.完成Map任务的输入数据分片读取

C.完成Reduce任务的最终结果写入HDFS

D.为各个计算任务分配对应的集群计算资源

答案

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档