大数据Spark题库及解析.docVIP

  • 4
  • 0
  • 约2.33千字
  • 约 8页
  • 2026-04-27 发布于上海
  • 举报

大数据Spark题库及解析

以下是包含试题和答案的试卷:

单项选择题(每题2分,共20分)

1.Spark的核心组件是什么?

A.Hadoop

B.Hive

C.SparkCore

D.HBase

答案:C

2.Spark默认的内存管理策略是什么?

A.JVM

B.Manual

C.Unified

D.Hybrid

答案:C

3.以下哪个不是Spark的RDD操作?

A.map

B.filter

C.reduce

D.join

答案:D

4.Spark的shuffle操作通常发生在哪个阶段?

A.map阶段

B.shuffle阶段

C.reduce阶段

D.filter阶段

答案:B

5.SparkSQL的入口是什么?

A.SparkContext

B.SQLContext

C.HiveContext

D.RDD

答案:B

6.以下哪个不是Spark的存储级别?

A.Memory

B.Disk

C.Off-heap

D.Cache

答案:C

7.Spark的RDD是不可变的,这个说法对吗?

A.对

B.错

答案:A

8.Spark的DataFrame和RDD有什么区别?

A.DataFrame是RDD的子类

B.DataFrame支持更多操作

C.DataFrame是RDD的别名

D.DataFrame性能更差

答案:B

9.Spark的集群管理器有哪些?

A.Standalone

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档