大数据导论期末考试试卷 .pdfVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

大数据导论期末考试试卷

题量:27满分:100.0截止日期:2020-06-2516:00

一、单选题

1.分布式系统比较常见的数据分布方式有()

A、哈希方式

B、按数据范围分布

C、按数据量分布

D、一致性哈希

E、以上都是

我的答案:E

2.以下选项不属于可视化基本特征的是()

A、易懂性

B、全面性

C、必然性

D、专业性

我的答案:B

3.数据清洗的方法有()

A、填充缺失值

B、修改错误值

C、消除重复记录

D、以上都是

我的答案:D

4.以下不属于云计算的服务模式的选项是()

A、IaaS

B、PaaS

C、SaaP

D、SaaS

我的答案:C

5.哪一年是中国的微博元年?

A、2008

B、2009

C、2010

D、2011

我的答案:C

6._是大数据的前沿技术。

A、数据处理

B、数据分析

C、数据定义

D、数据结构

我的答案:B

7.大数据赖以生存的土壤是_。

A、互联网

B、物联网

C、网络信息

D、前沿技术

我的答案:A

二、多选题

1.以下是大数据存储面临的挑战的选项是()

A、系统问题

B、数据问题

C、应用问题

D、管理问题

我的答案:ACD

2.目前来说,以下选项是解决数据集成的主要难题的是。

A、异构性

B、

分布性

C、自治性

D、同构性

我的答案:AB

3.数据挖掘常用算法有()

A、分类

B、聚类

C、特征分析

D、决策树归纳法

我的答案:ABCD

4.大数据的采集方法有()

A、系统日志采集方法

B、网络数据采集方法

C、数据库采集

D、以上都不正确

我的答案:AB

5.以下属于云计算的特点的是()

A、资源池弹性可扩张

B、虚拟化

C、以人为中心

D、高可靠和安全性

我的答案:ABD

三、判断题

1.大数据分析是大公司或是科技大厂的专利。

我的答案:×

2.数据预处理是指在主要的处理后对数据进行的一些处理。

我的答案:×

3.只要有数据,就必然存在安全与隐私的问题。

我的答案:√

4.在数据处理方面,有一个著名的“一秒定律”,即要在秒级时间范围内给出分析结果,超出

这个时间,数据就失去价值。

我的答案:√

5.与Oracle性能关系最大的是SGA。

我的答案:√

四、填空题

1.存储系统的类别有()、()、()

我的答案:

第一空:块存储

第二空:文件存储

第三空:对象存储

2.NoSQL数据库是()的缩写。

我的答案:

第一空:NotOnlySQL

3.()是大数据分析和应用的基础,()和()是数据分析的第一步。

我的答案:

第一空:数据

第二空:数据采集

第三空:预处理

4.大数据的4V特征分别是(),(),(),()

我的答案:

第一空:容量大(Volume)

第二空:多样性(Variety)

第三空:价值高(Value)

第四空:速度快(Velocity)

5.Hadoop核心模块包括()和()

我的答案:

第一空:HDFS

第二空:MapReduce

五、简答题

1.列举常用的大数据可视化软件与工具。

我的答案:

Excel

Processing

ECharts

2.数据集市与数据仓库的区别。

我的答案:

数据仓库向各个数据集市提供数据。前者是企业级,规模较大,后者是部门级,相对

规模较小。

若干个部门的数据集市组成一个数据仓库。数据集市开发周期短、速度快,数据仓库

开发周期长、速度慢。

从其数据特征进行分析,数据仓库中数据结构采用规范化模式,数据集市中的数据结

构采用星型模式。通常数据仓库中的数据粒度比数据集市中的粒度要细。

3.述数据仓库的构建步骤。

我的答案:

数据抽取、数据转换、数据装载、元数据管理

4.请回答大数据的4V特征?

我的答案:

容量大(Volume)

多样性(Variety)

价值高(Value)

速度快(Velocity)

5.简述什么是数据采集?

我的答案:

是大数据生命周期中的第一个环节,通过RFID射频数据、传感器数据、社交网络数据、

移动互联网数据等方式获得各种

文档评论(0)

152****8914 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档