2026年大数据工程师职业资格考试题库(附答案和详细解析)(0419).docxVIP

  • 0
  • 0
  • 约1.89千字
  • 约 3页
  • 2026-04-29 发布于上海
  • 举报

2026年大数据工程师职业资格考试题库(附答案和详细解析)(0419).docx

2026年大数据工程师职业资格考试题库(附答案和详细解析)(0419)

大数据工程师职业资格考试试卷

一、单项选择题(共10题,每题1分,共10分)

下列哪项是Hadoop生态系统的核心分布式存储组件?

A.HBase

B.Hive

C.HDFS

D.Spark

答案:C

解析:HDFS(HadoopDistributedFileSystem)是Hadoop的核心存储组件,提供高容错性的分布式文件存储。HBase是列式数据库,Hive是数据仓库工具,Spark是计算引擎。

在数据仓库设计中,“缓慢变化维”(SCD)的Type2处理方式是?

A.覆盖旧值

B.增加新行并标记时间戳

C.添加新列存储历史值

D.删除旧记录

答案:B

解析:SCDType2通过添加新行并记录生效时间戳来保留历史数据,是跟踪维度变化的常用方法。

(题目3-10略,按相同格式设计)

二、多项选择题(共10题,每题2分,共20分)

关于Kafka的特性,正确的选项有?

A.通过ZooKeeper管理集群元数据

B.采用Pull模式消费数据

C.消息持久化到磁盘

D.仅支持实时流处理

答案:ABC

解析:Kafka依赖ZooKeeper管理元数据(A正确);消费者主动拉取数据(B正确);消息持久化保障可靠性(C正确);D错误,Kafka也支持批处理。

下列哪些属于NoSQ

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档