- 0
- 0
- 约9.91千字
- 约 13页
- 2026-05-28 发布于河北
- 举报
2025年大数据架构设计与优化考试卷
考试时间:______分钟总分:______分姓名:______
一、选择题(每题2分,共20分。请将正确选项的代表字母填入括号内)
1.下列哪种存储模型最适合存储海量、增长迅速且查询模式不明确的非结构化或半结构化数据?
A.数据仓库
B.数据集市
C.数据湖
D.关系型数据库
2.在大数据处理框架中,MapReduce模型主要适用于哪种类型的数据处理任务?
A.低延迟的实时流处理
B.批量处理大规模数据集
C.高交互性的在线查询
D.分布式会话管理
3.下列哪个组件是Hadoop生态系统中负责分布式存储的海量文件系统的核心?
A.YARN
B.Hive
C.HDFS
D.ZooKeeper
4.以下关于Spark和MapReduce的比较,哪项描述是正确的?
A.Spark只能进行批处理,MapReduce只能进行流处理
B.Spark的容错机制比MapReduce更复杂
C.Spark通常在内存中进行计算,而MapReduce主要依赖磁盘
D.MapReduce的作业调度器比Spark更灵活
5.Kafka主要用于构建什么?
A.数据仓
原创力文档

文档评论(0)