- 1
- 0
- 约6.68千字
- 约 18页
- 2026-05-09 发布于四川
- 举报
2025年大数据技术相关试题及答案
一、单项选择题(每题2分,共20分)
1.以下关于大数据处理框架的描述,错误的是()
A.ApacheSpark的RDD(弹性分布式数据集)支持基于内存的迭代计算
B.ApacheFlink通过Checkpoint机制实现精确一次(Exactly-Once)处理语义
C.ApacheHadoopMapReduce适用于低延迟的实时数据处理场景
D.ApacheStorm是早期的流处理框架,支持高吞吐的实时计算
答案:C
解析:HadoopMapReduce基于磁盘的批处理模式,延迟较高,适合离线计算;实时处理需用流处理框架(如Flink、Storm)。
2.数据湖(DataLake)与传统数据仓库(DataWarehouse)的核心区别在于()
A.数据存储格式:数据湖仅支持结构化数据,数据仓库支持多模态数据
B.处理阶段:数据湖在存储时不定义模式(Schema-On-Read),数据仓库在存储前定义模式(Schema-On-Write)
C.应用场景:数据湖仅用于分析,数据仓库用于事务处理
D.数据质量:数据湖要求严格的数据清洗,数据仓库允许原始数据存储
答案:B
解析:数据湖的核心特征是“读时模式”,存储原始多模态数据;数据仓库是“写时模式”,需提前结
您可能关注的文档
最近下载
- 2024年最新初级保安员考试题库与参考答案.pdf VIP
- 免费vc中国象棋软件(一).doc VIP
- 2025至2030中国饮料容器涂料行业细分市场及应用领域与趋势展望研究报告.docx VIP
- 2024年保安员上岗证初级保安员考试题库.docx VIP
- 第八届中国淄博国际陶瓷博览会体彩绘.ppt VIP
- 2025最新初级保安员考试题库与参考答案.docx VIP
- 沪教版四年级上学期期末考试语文试卷(共5套,含参考答案).docx VIP
- 沪教版四年级下册语文期中考试试卷(共5套,含答案).docx VIP
- JDY-31-V1.3蓝牙SPP串口透传模块手册.pdf VIP
- 2离合器基本参数和尺寸的确定.docx VIP
原创力文档

文档评论(0)