spark期末考试题及答案.docxVIP

  • 0
  • 0
  • 约3.95千字
  • 约 12页
  • 2026-06-28 发布于河南
  • 举报

spark期末考试题及答案

一、单项选择题(共20分,每题2分)

1.在ApacheSpark中,RDD(弹性分布式数据集)的核心抽象是:

A.分布式共享内存

B.分布式只读记录集合

C.分布式数据库

D.分布式文件系统

答案:B

2.以下哪种运行模式不需要依赖外部的资源管理器(如YARN或Mesos)?

A.Standalone模式

B.YARN模式

C.SparkonKubernetes模式

D.Mesos模式

答案:A

3.在Spark中,以下哪个操作是转换操作(Transformation),它不会立即触发计算?

A.collect()

B.count()

C.map()

D.reduce()

答案:C

4.RDD之间的依赖关系分为窄依赖和宽依赖。以下哪个操作会产生宽依赖?

A.map()

B.filter()

C.reduceByKey()

D.union()

答案:C

5.SparkSQL的入口类是:

A.SparkContext

B.SQLContext

C.SparkSession

D.HiveContext

答案:C

6.广播变量主要用于在集群节点之间分发较大的只读变量,以减少任务间的通信开销。关于广播变量,以下说法正确的是:

A.广播变量可以在运行过程中被修改

B.

文档评论(0)

1亿VIP精品文档

相关文档