2026年大数据工程师职业资格考试题库(附答案和详细解析)(0124).docxVIP

  • 6
  • 0
  • 约8.74千字
  • 约 12页
  • 2026-04-21 发布于江苏
  • 举报

2026年大数据工程师职业资格考试题库(附答案和详细解析)(0124).docx

大数据工程师职业资格考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下关于HDFS(Hadoop分布式文件系统)的描述中,正确的是()。

A.HDFS默认块大小为32MB

B.HDFS适合存储大量小文件

C.NameNode负责存储数据块的元信息

D.DataNode直接处理客户端的文件读写请求

答案:C

解析:HDFS默认块大小为128MB(A错误);HDFS设计初衷是处理大文件,小文件会占用过多NameNode内存(B错误);NameNode管理文件系统元数据(如文件到块的映射),DataNode存储实际数据块并响应块级读写请求(C正确,D错误)。

以下不属于Spark核心抽象的是()。

A.RDD(弹性分布式数据集)

B.DataFrame

C.DStream(离散化流)

D.HiveContext

答案:D

解析:Spark核心抽象包括RDD(基础)、DataFrame/Dataset(结构化数据)、DStream(SparkStreaming的流抽象);HiveContext是用于连接Hive的上下文对象,属于扩展组件而非核心抽象(D错误)。

关于Kafka的分区(Partition)机制,正确的描述是()。

A.分区数越多,消息顺序性越强

B.每个分区只能被一个消费者组中的一个消费者消费

C.分区是Kafka实现负载均衡的最小单

文档评论(0)

1亿VIP精品文档

相关文档