2026年spark期末考试题及答案.docVIP

  • 0
  • 0
  • 约3.96千字
  • 约 10页
  • 2026-06-25 发布于辽宁
  • 举报

2026年spark期末考试题及答案

一、填空题(每题2分,共20分)

1.Spark的核心组件是______。

2.RDD的三个基本操作是______、______和______。

3.Spark的RDD持久化机制中,______是一种按需计算的方式。

4.Spark的DataFrameAPI是基于______构建的。

5.Spark的SparkSQL中,______是一种分布式数据存储格式。

6.Spark的Streaming中,______是一种处理实时数据流的时间窗口机制。

7.Spark的MLlib中,______是一种常用的分类算法。

8.Spark的集群管理器中,______是一种常用的资源管理器。

9.Spark的Catalyst优化器中,______是一种常用的优化策略。

10.Spark的动态资源分配中,______是一种常用的资源分配策略。

二、判断题(每题2分,共20分)

1.Spark的RDD是不可变的。()

2.Spark的DataFrame是懒执行的。()

3.Spark的SparkSQL不支持窗口函数。()

4.Spark的Streaming可以处理有状态的计算。()

5.Spark的MLlib不支持聚类算法。()

6.Spark的集群管理器只能使用YARN。()

7.Spark的Catalyst优化器不支持规

文档评论(0)

1亿VIP精品文档

相关文档