2026年大数据工程师职业资格考试题库(附答案和详细解析)(0305).docxVIP

  • 3
  • 0
  • 约7.52千字
  • 约 11页
  • 2026-04-23 发布于上海
  • 举报

2026年大数据工程师职业资格考试题库(附答案和详细解析)(0305).docx

大数据工程师职业资格考试试卷

一、单项选择题(共10题,每题1分,共10分)

HDFS的NameNode主要负责以下哪项功能?

A.存储数据块

B.管理元数据(文件目录、副本信息等)

C.执行MapReduce任务

D.处理客户端的读写请求

答案:B

解析:HDFS采用主从架构,NameNode作为主节点,负责管理文件系统的元数据(如文件路径、副本数、块位置信息);DataNode作为从节点存储实际数据块(A错误);MapReduce任务由YARN调度执行(C错误);客户端读写请求需通过NameNode获取元数据后与DataNode交互(D错误)。

以下哪项是SparkRDD的核心特性?

A.内存中可变性

B.自动容错与血统(Lineage)

C.仅支持批处理

D.依赖关系不可追溯

答案:B

解析:RDD(弹性分布式数据集)是Spark的核心抽象,其特性包括不可变性(A错误)、基于血统的容错(通过记录父RDD的转换操作实现自动恢复,B正确)、支持批处理和流处理(如SparkStreaming,C错误)、依赖关系可追溯(D错误)。

Kafka中“ConsumerGroup”的主要作用是?

A.保证消息按顺序投递

B.实现消息的广播与负载均衡

C.存储消息的元数据

D.管理生产者的连接

答案:B

解析:ConsumerGroup通过将消费者实例分组,实现

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档