2026年大数据工程师职业资格考试题库(附答案和详细解析)(0222).docxVIP

  • 0
  • 0
  • 约6.98千字
  • 约 11页
  • 2026-03-23 发布于上海
  • 举报

2026年大数据工程师职业资格考试题库(附答案和详细解析)(0222).docx

大数据工程师职业资格考试试卷

一、单项选择题(共10题,每题1分,共10分)

HDFS默认的块大小是?

A.64MB

B.128MB

C.256MB

D.512MB

答案:B

解析:HDFS设计时将块大小默认设置为128MB(早期版本为64MB),较大的块大小减少了NameNode的元数据管理开销,适合大文件存储。错误选项中,64MB是旧版本默认值,256MB和512MB为自定义常见配置,非默认。

Spark的核心抽象是?

A.DataFrame

B.Dataset

C.RDD

D.DStream

答案:C

解析:RDD(弹性分布式数据集)是Spark的核心数据抽象,支持容错、并行操作和惰性计算。DataFrame和Dataset是RDD的高层抽象,DStream是SparkStreaming的时间序列抽象,均非核心。

Kafka的主要用途是?

A.分布式数据库

B.实时计算框架

C.消息队列与流数据平台

D.分布式文件系统

答案:C

解析:Kafka是高吞吐量的分布式消息队列,主要用于处理实时数据流的发布与订阅。错误选项中,分布式数据库对应HBase,实时计算框架对应Flink,分布式文件系统对应HDFS。

数据倾斜的典型表现是?

A.所有任务均匀执行

B.部分任务执行时间显著延长

C.内存占用整体降低

D.CPU利用率全面下降

答案:B

解析:

文档评论(0)

1亿VIP精品文档

相关文档