2025年大数据考试题含答案.docxVIP

  • 0
  • 0
  • 约4.79千字
  • 约 13页
  • 2026-05-09 发布于四川
  • 举报

2025年大数据考试题含答案

一、单项选择题(每题2分,共20分)

1.以下哪项不属于数据清洗的核心操作?

A.处理缺失值

B.标准化数据格式

C.特征提取

D.纠正逻辑错误

答案:C

2.在Hadoop分布式文件系统(HDFS)中,NameNode的主要功能是?

A.存储数据块元信息

B.直接存储用户数据

C.执行计算任务

D.管理集群网络通信

答案:A

3.Spark中RDD(弹性分布式数据集)的核心特性是?

A.不可变且可分区

B.实时写入与更新

C.单节点内存存储

D.仅支持批处理

答案:A

4.数据湖(DataLake)与传统数据仓库(DataWarehouse)的主要区别在于?

A.数据湖仅存储结构化数据,数据仓库支持多类型数据

B.数据湖强调存储原始数据,数据仓库侧重清洗后的数据

C.数据湖依赖关系型数据库,数据仓库使用分布式文件系统

D.数据湖不支持查询分析,数据仓库支持复杂查询

答案:B

5.以下哪种流处理框架更适合低延迟、高吞吐的实时计算场景?

A.ApacheHive

B.ApacheFlink

C.ApachePig

D.ApacheSqoop

答案:B

6.在分布式数据库(如TiDB

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档