- 1
- 0
- 约2.2千字
- 约 6页
- 2026-05-04 发布于湖南
- 举报
2026年大数据(Spark应用)试题及答案
(考试时间:90分钟满分100分)
班级______姓名______
第I卷(选择题共40分)
1.Spark中用于分布式数据集的基本抽象是()(本题5分,答题要求:请从以下选项中选择正确答案)
A.RDD
B.DataFrame
C.Dataset
D.SQLContext
答案:A
2.以下哪个不是Spark的组件()(本题5分,答题要求:请从以下选项中选择正确答案)
A.SparkCore
B.SparkSQL
C.Hadoop
D.SparkStreaming
答案:C
3.在Spark中,用于将RDD持久化的方法是()(本题5分,答题要求:请从以下选项中选择正确答案)
A.cache
B.persist
C.bothAandB
D.以上都不对
答案:C
4.SparkSQL中用于执行SQL查询的方法是()(本题5分,答题要求:请从以下选项中选择正确答案)
A.sql
B.execute
C.run
D.query
答案:A
5.对于SparkStreaming,窗口操作的时间间隔是通过什么参数设置的()(本题5分,答题要求:请从以下选项中选择正确答案)
A.windowDuration
B.slideDuratio
原创力文档

文档评论(0)