南开大学20秋学期《大数据导论》在线作业(参考答案).docxVIP

南开大学20秋学期《大数据导论》在线作业(参考答案).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

1.大数据的特点不包含()。

A.数据体量大

B.价值密度高

C.处理速度快

D.数据不统一

答案:D

2.大数据的最显著特征是()。

A.数据规模大

B.数据类型多样

C.数据处理速度快

D.数据价值密度高

答案:A

3.数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段?()

A.运营式系统阶段

B.用户原创内容阶段

C.感知式系统阶段

答案:C

4.下列哪个工具常用来开发移动友好地交互地图?()

A.Leaflet

B.Visual.ly

C.BPizzaPieCharts

D.Gephi

答案:A

5.医疗健康数据的基本情况不包括以下哪项?()

A.诊疗数据

B.个人健康管理数据

C.公共安全数据

D.健康档案数据

答案:C

6.数据仓库是随着时间变化的,下列不正确的是()。

A.数据仓库随时间变化不断增加新内容

B.捕捉到的新数据会覆盖原来的快照

C.数据仓库随事件变化不断删去旧的数据内容

D.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合

答案:C

7.IaaS是()的简称。

A.软件即服务

B.平台即服务

C.基础设施即服务

D.硬件即服务

答案:C

8.哪个选项不属于大数据4V特点?()

A.Volume

B.Valid

C.Variety

D.Value

答案:B

9.第一个提出大数据概念的公司是()。

A.麦肯锡公司

B.谷歌公司

C.微软公司

D.脸谱公司

答案:A

10.MapReduce中的Map和Reduce函数使用()进行输入输出。

A.key/value对

B.随机数值

C.其他计算结果

答案:A

11.数据清洗的方法不包括()。

A.缺失值处理

B.噪声数据清除

C.一致性检查

D.重复数据记录处理

答案:D

12.以下不是数据仓库基本特征的是()。

A.数据仓库是面向主题的

B.数据仓库是面向事务的

C.数据仓库的数据是相对稳定的

D.数据仓库的数据是反映历史变化的

答案:B

13.下列不属于Google云计算平台技术架构的是()。

A.并行数据处理MapReduce

B.分布式锁Chubby

C.结构化数据表BigTable

D.弹性云计算EC2

答案:D

14.下列哪个R语言扩展包可以创建带有点和边的网络图?()

A.ggplot2

B.network

C.ggmaps

D.animation

答案:B

15.基础设施即服务的英文简称是()。

A.IaaS

B.PaaS

C.SaaS

答案:A

16.大数据时代预测人类移动行为的数据特点是()。

A.多样化

B.数据量大

C.维数高

D.变化快

答案:BCD

17.借助于大数据提供的()和(),政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。

A.消费能力

B.趋势报告

C.购物结果

答案:AB

18.关于R语言扩展包下列正确的是()。

A.network可创建带有点和边的网络图

B.animation可制作一系列的图像并将它们串联起来做成动画

C.ggmaps通过树图来可视化层次型数据

D.protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具

答案:AB

19.网络数据采集常用的是通过()或()等方式从网站上获取数据信息。

A.网络爬虫

B.网站公开API

C.手动获取

答案:AB

20.数据分析的类型根据数据分析深度可以分为()。

A.描述性分析

B.预测性分析s

C.规则性分析

答案:ABC

21.数据变换(DataTransformation)的方法有()。

A.光滑

B.聚集

C.数据泛化

D.规范化

答案:ABCD

22.按照数据量的大小,可将数据分析分为()。

A.内存级数据分析

B.Bl级数据分析

C.海量级数据分析

D.巨量级数据分析

答案:ABC

23.可使用(),(),()进行光滑。

A.最大值

B.箱中位数

C.箱边界

D.箱均值

答案:BCD

24.常见的分类方法有()。

A.决策树

B.贝叶斯网络

C.遗传算法

D.FP算法

答案:ABC

25.医疗大数据特点:除了包含了大数据4个“V”的特点之外还有()。

A.多态性

B.时效性

C.不完整性

D.冗余性

答案:ABCD

26.大数据在医疗中的应用有()。

A.流行性疾病预防

B.慢性病健康管理

C.临床决策支持

D.医疗器械研发

答案:ABCD

27.一个HDFS集群由一个()和()构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。

A.一个名字节点

B.若干个名字节点

C.一个数据节点

D.若干个数据节点

答案:AD

28.主流分布式计算平台有()。

A.google

B.IBM

C.baidu

D.Amazon

答案:

文档评论(0)

clevercatty + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档