网站大量收购独家精品文档,联系QQ:2885784924

22春南开大学《大数据开发技术》在线作业一答案参考2.pdfVIP

22春南开大学《大数据开发技术》在线作业一答案参考2.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

22春南开大学《大数据开发技术》在线作业一答案参考

1.大数据时代预测人类移动行为的数据来源有()。

A.志愿者定位数据

B.装有导航设备的出租车轨迹数据

C.手机终端定位于通讯记录

D.社会网络签到数据

参考答案:ABCD

2.GraphX中()是存放着Edg对象的RDD

A.RDD[Edge]

B.EdgeRDD

C.RDD[(VertexId,VD)]

D.VertexRDD

参考答案:A

3.HDFS中SecondaryNameNode可减少()重启的时间

A.NameNode

B.SecondaryNameNode

C.DataNode

D.Block

参考答案:A

4.最大效益优先是下列哪项的一种搜索方式?()

A.分支界限法

B.动态规划法

C.贪心法

D.回溯法

参考答案:A

5.Spark中DataFrame的()方法是进行排序查询

A.orderby

B.groupby

C.selectby

D.sortby

参考答案:A

6.Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是()

A.filter

B.foreach

C.map

D.mkString

参考答案:D

7.Graph类中如果根据边数据创建图,数据需要转换成RDD[Edge[ED]类型,应该

用()方法

A.Graph(vertices,edges,defaultVertexAttr)

B.Graph.fromEdges(RDD[Edge[ED]],defaultValue)

C.Graph.fromEdgeTuples(rawEdges:RDD[(VertexId,VertexId)],defaultValue

D.GraphLoader.edgeListFile(sc,filename)

参考答案:B

8.SparkDataFrame中()方法可以返回一个List

A.collect

B.take

C.takeAsList

D.collectAsList

参考答案:CD

9.分支限界法与回溯法的求解目标相同。()

A.错误

B.正确

参考答案:A

10.HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件

和文件夹的元数据。()

A.正确

B.错误

参考答案:B

11.1秒定律体现了大数据的哪个特征()。

A.数据量大

B.数据产生速度快

C.数据存储快

D.数据计算快

参考答案:B

12.Scala函数组合器可以接收一个可以处理嵌套列表的函数,然后把返回结果连

接起来的方法是()

A.map

B.foreach

C.flatten

D.flatmap

参考答案:D

13.关联分析又称为关联规则学习。()

A.对

B.错

参考答案:A

14.最长公共子序列算法利用的算法是()。

A.分支界限法

B.动态规划法

C.贪心法

D.回溯法

参考答案:B

15.每个变量的最大值和最小值之差称为极差。()

A.对

B.错

参考答案:A

16.Pentaho是最流行的开源商业智能软件之一。()

A.对

B.错

参考答案:A

17.MapReduce设计的一个理念就是(),因为移动数据需要大量的网络传输开

销。

A.数据向计算靠拢

B.计算向数据靠拢

C.计算向网络靠拢

D.计算与数据并行

参考答案:B

18.以下算法中属于无监督学习算法的是()

A.KNN算法

B.逻辑回归

C.随机森林

D.Kmeans

参考答案:D

19.Spark中Dat

文档评论(0)

151****6399 + 关注
实名认证
文档贡献者

大专毕业生

1亿VIP精品文档

相关文档