2026年大数据工程师职业资格考试题库(附答案和详细解析)(0203).docxVIP

  • 0
  • 0
  • 约8.86千字
  • 约 11页
  • 2026-03-19 发布于上海
  • 举报

2026年大数据工程师职业资格考试题库(附答案和详细解析)(0203).docx

大数据工程师职业资格考试试卷

一、单项选择题(共10题,每题1分,共10分)

Hadoop分布式文件系统(HDFS)的核心架构中,负责管理文件元数据(如文件目录、块位置)的组件是?

A.DataNode

B.NameNode

C.SecondaryNameNode

D.ResourceManager

答案:B

解析:HDFS采用主从架构,NameNode作为主节点,负责存储和管理文件系统的元数据(如文件目录结构、块到DataNode的映射);DataNode(A)是从节点,负责存储实际数据块;SecondaryNameNode(C)辅助NameNode进行元数据检查点,并非核心管理组件;ResourceManager(D)是YARN的资源管理组件,与HDFS元数据无关。

Spark中RDD(弹性分布式数据集)的核心特性不包括?

A.不可变性

B.支持原地修改

C.弹性(自动容错)

D.分布式存储

答案:B

解析:RDD是Spark的核心抽象,具有不可变性(A正确,数据生成后不可修改)、弹性(C正确,通过血统(Lineage)实现容错)、分布式存储(D正确)。RDD不支持原地修改(B错误,修改操作会生成新RDD)。

以下哪项是Flink流处理中“事件时间(EventTime)”的典型应用场景?

A.基于任务启动时间统计数据

B.基于数据实际产生时间计算窗口

C.

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档