2026年国开电大大数据技术概论形考题库100道附参考答案(培优a卷).docxVIP

  • 1
  • 0
  • 约2.41万字
  • 约 38页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道附参考答案(培优a卷).docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、在大数据处理中,Spark相比MapReduce的显著优势是?

A.仅适用于批处理任务

B.采用磁盘存储中间结果

C.支持内存计算,速度更快

D.不支持实时流处理

【答案】:C

解析:本题考察Spark与MapReduce的技术对比知识点。Spark是内存计算框架,中间结果存储在内存中,大幅减少磁盘I/O,因此处理速度远快于基于磁盘的MapReduce(批处理框架),C选项正确。A选项错误,Spark同时支持批处理和流处理(如SparkStreaming);B选项错误,Spark优先使用内存而非磁盘存储;D选项错误,Spark支持实时流处理。

2、在Hadoop生态系统中,负责分布式数据存储的核心组件是?

A.HDFS(分布式文件系统)

B.MapReduce(分布式计算框架)

C.YARN(资源管理器)

D.ZooKeeper(分布式协调服务)

【答案】:A

解析:本题考察Hadoop生态系统核心组件功能,正确答案为A。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,专为存储海量数据设计,支持高容错、高吞吐量的数据存储;B选项MapReduce是基于HDFS的分布式计算框架,负责并行计算任务;C选项YARN是Hadoop

文档评论(0)

1亿VIP精品文档

相关文档