2025年大数据技术相关试题及答案.docxVIP

  • 1
  • 0
  • 约6.68千字
  • 约 18页
  • 2026-05-09 发布于四川
  • 举报

2025年大数据技术相关试题及答案

一、单项选择题(每题2分,共20分)

1.以下关于大数据处理框架的描述,错误的是()

A.ApacheSpark的RDD(弹性分布式数据集)支持基于内存的迭代计算

B.ApacheFlink通过Checkpoint机制实现精确一次(Exactly-Once)处理语义

C.ApacheHadoopMapReduce适用于低延迟的实时数据处理场景

D.ApacheStorm是早期的流处理框架,支持高吞吐的实时计算

答案:C

解析:HadoopMapReduce基于磁盘的批处理模式,延迟较高,适合离线计算;实时处理需用流处理框架(如Flink、Storm)。

2.数据湖(DataLake)与传统数据仓库(DataWarehouse)的核心区别在于()

A.数据存储格式:数据湖仅支持结构化数据,数据仓库支持多模态数据

B.处理阶段:数据湖在存储时不定义模式(Schema-On-Read),数据仓库在存储前定义模式(Schema-On-Write)

C.应用场景:数据湖仅用于分析,数据仓库用于事务处理

D.数据质量:数据湖要求严格的数据清洗,数据仓库允许原始数据存储

答案:B

解析:数据湖的核心特征是“读时模式”,存储原始多模态数据;数据仓库是“写时模式”,需提前结

文档评论(0)

1亿VIP精品文档

相关文档