2026年大数据工程师职业资格考试题库(附答案和详细解析)(0214).docxVIP

  • 1
  • 0
  • 约8.55千字
  • 约 12页
  • 2026-03-22 发布于上海
  • 举报

2026年大数据工程师职业资格考试题库(附答案和详细解析)(0214).docx

大数据工程师职业资格考试试卷

一、单项选择题(共10题,每题1分,共10分)

HDFS默认的块大小是以下哪一项?

A.64MB

B.128MB

C.256MB

D.512MB

答案:B

解析:Hadoop2.x及以上版本中,HDFS默认块大小为128MB(旧版本Hadoop1.x为64MB),设计大块大小是为了减少NameNode内存占用并提升大文件读写效率。错误选项A是旧版本配置,C、D为常见干扰值。

以下哪项是SparkRDD的核心特性?

A.支持事务性写入

B.不可变且可分区

C.存储结构化数据

D.实时流处理原生支持

答案:B

解析:RDD(弹性分布式数据集)的核心特性包括不可变性(一旦创建不可修改)、可分区(分布式存储)、容错性(通过血统Lineage重建)。A错误(RDD不支持事务),C错误(RDD是通用数据结构,不限于结构化),D错误(原生流处理是SparkStreaming的特性)。

数据仓库(DW)与数据库(DB)的本质区别是?

A.存储容量更大

B.支持实时写入

C.面向分析而非事务

D.使用SQL查询

答案:C

解析:数据仓库的核心设计目标是支持复杂分析(OLAP),而数据库主要支持事务处理(OLTP)。A错误(容量非本质区别),B错误(数据仓库通常是批量写入),D错误(两者均可用SQL)。

Flink中用于处理乱序事件的时间类

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档