南开大学24秋“物联网工程”《大数据开发技术(二)》考试历年常考点试题选编附答案.docxVIP

  • 0
  • 0
  • 约1.1千字
  • 约 4页
  • 2025-06-26 发布于四川
  • 举报

南开大学24秋“物联网工程”《大数据开发技术(二)》考试历年常考点试题选编附答案.docx

南开大学24秋“物联网工程”《大数据开发技术(二)》考试历年常考点试题选编附答案

第1卷

一.综合考核(共15题)

1.Scala中()方法返回一个列表,包含除了最后一个元素之外的其他元素

A.head

B.init

C.tail

D.last

2.RDD的cartesian函数是笛卡尔积,也就是将两个集合的元素两两组合成一组。()

A.正确

B.错误

3.MapReudce不适合()任务。

A.大数据计算

B.迭代

C.交互式

D.离线分析

4.图是一种数据元素间为()关系的数据结构

A.多对多

B.一对一

C.一对多

D.多对一

5.RDD的filter过滤会将返回值为true的过滤掉。()

T.对

F.错

6.Scala函数组合器可以把一个二维的列表展开成一个一维的列表的方法是()

7.Spark中的RDD的说法正确的是()。

A.弹性分布式数据集

B.是Spark中最基本的数据抽象

C.代表一个可变的集合

D.代表的集合里面的元素可并行计算

8.Spark可以从()分布式文件系统中读取数据

A.HDFS

B.Hbase

C.Hive

D.Tachyon

9.Scala是ScalableLanguage的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。()

A.正确

B.错误

10.以下哪个函数可以对两个RDD进行合并()

A.union

B.substract

C.intersection

D.cartesian

11.SparkStreming中()函数可以通过对源DStream的每RDD应用RDD-to-RDD函数返回一个新的DStream,这可以用来在DStream做任意RDD操作。

A.trans

B.reduce

C.join

D.cogroup

12.SparkR(名词解释)

13.Spark持久化RDD后,在再一次需要计算该RDD时将需要重新计算。()

A.正确

B.错误

14.Scala中数组的第一个元素索引为1。()

A.正确

B.错误

15.Scala中定义函数的关键字是()

第1卷参考答案

一.综合考核

1.参考答案:B

2.参考答案:A

3.参考答案:BC

4.参考答案:A

5.参考答案:F

6.参考答案:flatten

7.参考答案:ABD

8.参考答案:ABCD

9.参考答案:B

10.参考答案:A

11.参考答案:A

12.参考答案:SparkR是AMPLab发布的一个R开发包,使得R摆脱单机运行的命运,可以作为Spark的Job运行在集群上。

13.参考答案:B

14.参考答案:B

15.参考答案:ef

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档