2026年大数据工程师职业资格考试题库(附答案和详细解析)(0306).docxVIP

  • 6
  • 0
  • 约8.13千字
  • 约 11页
  • 2026-04-21 发布于上海
  • 举报

2026年大数据工程师职业资格考试题库(附答案和详细解析)(0306).docx

大数据工程师职业资格考试试卷

一、单项选择题(共10题,每题1分,共10分)

HDFS默认的块大小是以下哪一项?

A.32MB

B.64MB

C.128MB

D.256MB

答案:C

解析:HDFS设计时为了降低寻址开销并适配大文件存储,默认块大小设置为128MB(Hadoop2.x及以上版本)。选项A(32MB)是早期Hadoop1.x的默认块大小;B(64MB)是HDFS设计时的初始建议值;D(256MB)是用户可自定义的常见配置,但非默认值。

Spark中RDD的核心特性是?

A.可变的分布式数据集

B.支持单点故障自动恢复

C.仅存储结构化数据

D.基于内存的迭代计算

答案:D

解析:RDD(弹性分布式数据集)的核心特性是不可变、可分区、支持内存计算和基于血统(Lineage)的容错。选项A错误(RDD不可变);B错误(自动恢复依赖Lineage而非单点故障检测);C错误(RDD支持非结构化数据);D正确(内存计算是Spark区别于MapReduce的关键优势)。

Flink中用于处理乱序事件的核心机制是?

A.窗口触发

B.水印(Watermark)

C.状态后端

D.检查点(Checkpoint)

答案:B

解析:水印是Flink处理事件时间乱序的核心机制,通过设置延迟时间戳标记“后续不会有更早的数据”,触发窗口计算。选项A(窗口触发)是计算

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档