大数据Spark题目及分析.docxVIP

  • 3
  • 0
  • 约1.07万字
  • 约 25页
  • 2026-06-26 发布于湖北
  • 举报

大数据Spark题目及分析

一、单项选择题(共10题,每题1分,共10分)

下列哪项是Spark的底层核心计算引擎?

A.SparkCore

B.SparkSQL

C.SparkStreaming

D.MLlib

答案:A

解析:SparkCore是Spark的底层核心引擎,负责任务调度、内存管理、RDD运算等核心逻辑,其他选项都是基于SparkCore封装的上层应用组件,其中SparkSQL面向结构化数据查询,SparkStreaming面向流数据处理,MLlib面向机器学习场景。

下列哪项不属于RDD的固有核心特性?

A.分区列表

B.自动进行数据压缩存储

C.每个分区对应独立的计算函数

D.父RDD依赖关系列表

答案:B

解析:RDD的五大核心特性包括分区列表、每个分区的计算函数、依赖关系、可选分区器、最优位置计算,自动数据压缩是Spark的可选配置能力,不属于RDD的固有核心特性。

下列哪种Spark运行模式不需要依赖外部资源管理调度框架?

A.YARN模式

B.Standalone模式

C.Kubernetes模式

D.Mesos模式

答案:B

解析:Standalone是Spark自带的集群资源管理模式,不需要依赖外部资源调度框架,其他三个选项都需要对应外部框架负责资源调度,其中YARN是Hadoop生态的资源管理器,Kuberne

文档评论(0)

1亿VIP精品文档

相关文档