2026年大数据工程师职业资格考试题库(附答案和详细解析)(0420).docxVIP

  • 0
  • 0
  • 约2.1千字
  • 约 3页
  • 2026-04-30 发布于上海
  • 举报

2026年大数据工程师职业资格考试题库(附答案和详细解析)(0420).docx

2026年大数据工程师职业资格考试题库(附答案和详细解析)(0420)

大数据工程师职业资格考试试卷

一、单项选择题(共10题,每题1分,共10分)

在Hadoop生态系统中,负责资源管理和作业调度的组件是:

A.HDFS

B.MapReduce

C.YARN

D.HBase

答案:C

解析:YARN(YetAnotherResourceNegotiator)是Hadoop2.0引入的核心组件,负责集群资源管理和作业调度。HDFS是分布式文件系统(A错误),MapReduce是计算框架(B错误),HBase是NoSQL数据库(D错误)。

下列哪项不属于NoSQL数据库类型?

A.键值存储

B.文档数据库

C.关系数据库

D.列式存储

答案:C

解析:关系数据库属于SQL数据库范畴(如MySQL),而NoSQL包括键值存储(如Redis)、文档数据库(如MongoDB)和列式存储(如Cassandra)(A/B/D正确)。

二、多项选择题(共10题,每题2分,共20分)

数据清洗的主要任务包括:(多选)

A.删除重复数据

B.填补缺失值

C.转换数据类型

D.修改原始数据源

答案:ABC

解析:数据清洗聚焦于数据质量提升:删除重复值保证唯一性(A),填补缺失值保证完整性(B),转换数据类型确保一致性(C)。修改原始数据源违反数据治理原则(D

文档评论(0)

1亿VIP精品文档

相关文档