2026年国开电大大数据技术概论形考题库100道附参考答案（培优a卷）.docxVIP

下载本文档

1
0
约2.41万字
约 38页
2026-03-09 发布于河南
举报

2026年国开电大大数据技术概论形考题库100道附参考答案（培优a卷）.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、在大数据处理中，Spark相比MapReduce的显著优势是？

A.仅适用于批处理任务

B.采用磁盘存储中间结果

C.支持内存计算，速度更快

D.不支持实时流处理

【答案】：C

解析：本题考察Spark与MapReduce的技术对比知识点。Spark是内存计算框架，中间结果存储在内存中，大幅减少磁盘I/O，因此处理速度远快于基于磁盘的MapReduce（批处理框架），C选项正确。A选项错误，Spark同时支持批处理和流处理（如SparkStreaming）；B选项错误，Spark优先使用内存而非磁盘存储；D选项错误，Spark支持实时流处理。

2、在Hadoop生态系统中，负责分布式数据存储的核心组件是？

A.HDFS（分布式文件系统）

B.MapReduce（分布式计算框架）

C.YARN（资源管理器）

D.ZooKeeper（分布式协调服务）

【答案】：A

解析：本题考察Hadoop生态系统核心组件功能，正确答案为A。HDFS（HadoopDistributedFileSystem）是Hadoop的分布式文件系统，专为存储海量数据设计，支持高容错、高吞吐量的数据存储；B选项MapReduce是基于HDFS的分布式计算框架，负责并行计算任务；C选项YARN是Hadoop

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

2026年国开电大大数据技术概论形考题库100道附参考答案（培优a卷）.docxVIP