《大数据技术原理及应用》题目 .pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

大数据技术原理与应用

第一卷

一:判断题(每小题5分)

1:对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据

收集的信息量要尽量精确。

A:对B:错

答案:B

2:Spark是一个高效的分布式计算系统,它有MapReduce所有优点,同时性能与

Hadoop一样高。

A:对B:错

答案:B

3:信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。

A:对B:错

答案:B

4:简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样

本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。

A:对B:错

答案:B

5:大数据预测能够分析和挖掘出人们不知道或没有注意到的模式,确定判断事件必然

会发生。

A:对B:错

答案:B

二:单选题(每小题5分)

6:数据清洗的方法不包括______

A缺失值处理B噪声数据清除C一致性检查D重复数据记录处理

答案:D

7:大数据的基本特征不包括______

A数据量大B数据类型繁多C处理速度快D价值密度高

答案:D

8:HDFS中当前block大小为128M,如果当前要上传到HDFS中的文件大小为300M,

那么在存储时会分配_______个block进行存储

A1B2C3D4

答案:C

9:下列______程序通常与NameNode在一个节点启动

ASecondNameNodeBDataNodeCTaskTrackerDJobTracker

答案:D

10:配置Hadoop时,JAVA_HOME包含在______配置文件中

Ahadoop-default.xmlBhadoop-env.shChadoop-site.xmlDconfiguration.xs

答案:B

11:在数据生命周期管理实践中______是执行方法

A数据存储和备份规范B数据管理和维护C数据价值发觉和利用D数据应用开发和

管理

答案:B

12:HBase系统基本架构中主服务器Master的作用是______

A包含访问HBase的接口,同时在缓存中维护着已经访问过的Region位置信息,用

来加快后续数据访问过程B可以帮助选举出一个Master作为集群的总管,并保证在任何

时刻总有唯一一个Master在运行C主要负责表和Region的管理工作D是HBase中最

核心的模块,负责维护分配给自己的Region,并响应用户的读写请求

答案:C

13:Hadoop具有特性不包括______

A高可靠性B高效性C高可扩展性D低容错性,

答案:D

14:YARN的http端口默认是______

A80B8080C8090D8088

答案:D

15:大数据时代,数据使用的关键是______

A数据收集B数据存储C数据分析D数据再利用

答案:D

三:多选题(每小题5分)

16:大数据人才整体上需要具备______等核心知识

A数学与统计知识B计算机相关知识C马克思主义哲学知识D市场运营管理知识E

在特定业务领域的知识

答案:ABE

17:下列关于数据生命周期管理的核心认识中,正确的是______

A数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段B在不同的数据

存在阶段,数据的价值是不同的C根据数据价值的不同应该对数据采取不同的管理策略D

数据生命周期管理旨在产生效益的同时,降低生产成本

答案:ABC

18:数据研究经历了几种范式,包括______

A实验B理论C计算D数据

答案:ABCD

19:按照涉及自变量的多少,可以将回归分析分为______

文档评论(0)

. + 关注
官方认证
文档贡献者

专注于职业教育考试,学历提升。

版权声明书
用户编号:8032132030000054
认证主体社旗县清显文具店
IP属地江苏
统一社会信用代码/组织机构代码
92411327MA45REK87Q

1亿VIP精品文档

相关文档