2026 年大数据(Spark 应用)试题及答案.docVIP

  • 1
  • 0
  • 约2.2千字
  • 约 6页
  • 2026-05-04 发布于湖南
  • 举报

2026 年大数据(Spark 应用)试题及答案.doc

2026年大数据(Spark应用)试题及答案

(考试时间:90分钟满分100分)

班级______姓名______

第I卷(选择题共40分)

1.Spark中用于分布式数据集的基本抽象是()(本题5分,答题要求:请从以下选项中选择正确答案)

A.RDD

B.DataFrame

C.Dataset

D.SQLContext

答案:A

2.以下哪个不是Spark的组件()(本题5分,答题要求:请从以下选项中选择正确答案)

A.SparkCore

B.SparkSQL

C.Hadoop

D.SparkStreaming

答案:C

3.在Spark中,用于将RDD持久化的方法是()(本题5分,答题要求:请从以下选项中选择正确答案)

A.cache

B.persist

C.bothAandB

D.以上都不对

答案:C

4.SparkSQL中用于执行SQL查询的方法是()(本题5分,答题要求:请从以下选项中选择正确答案)

A.sql

B.execute

C.run

D.query

答案:A

5.对于SparkStreaming,窗口操作的时间间隔是通过什么参数设置的()(本题5分,答题要求:请从以下选项中选择正确答案)

A.windowDuration

B.slideDuratio

文档评论(0)

1亿VIP精品文档

相关文档