大数据Spark分析试题及答案.docxVIP

  • 3
  • 0
  • 约1.23万字
  • 约 28页
  • 2026-06-24 发布于上海
  • 举报

大数据Spark分析试题及答案

一、单项选择题(共10题,每题1分,共10分)

以下哪一项是Spark最核心的分布式内存抽象概念

A.分布式文件系统HDFS

B.弹性分布式数据集RDD

C.资源调度框架YARN

D.分布式计算引擎MapReduce

答案:B

解析:RDD是Spark官方定义的核心弹性分布式数据集,是所有Spark计算的基础抽象。A选项HDFS是Hadoop生态的分布式存储组件,不属于Spark的核心抽象;C选项YARN是通用的集群资源调度框架,并非Spark独有的核心概念;D选项MapReduce是Hadoop生态的第一代分布式计算引擎,和Spark是并行的同类组件。

文档评论(0)

1亿VIP精品文档

相关文档