大数据选择题题库及答案.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

大数据选择题题库及答案

一、单项选择题(每题2分,共10题)

1.大数据的4V特征不包括以下哪一项?()

A.Volume

B.Variety

C.Velocity

D.Value

答案:D

解析:大数据的4V特征是Volume(大量)、Variety(多样)、Velocity(高速)、Value(价值),这里问的是不包括的,所以选D。

2.以下哪种技术常用于大数据的存储?()

A.Hadoop

B.Spark

C.Python

D.Java

答案:A

解析:Hadoop是常用的大数据存储框架,Spark主要用于大数据计算,Python和Java是编程语言,所以选A。

3.大数据处理流程的第一步通常是()

A.数据清洗

B.数据采集

C.数据分析

D.数据可视化

答案:B

解析:没有数据采集就没有后续的数据处理,所以第一步通常是数据采集,选B。

4.下列哪个不是大数据分析的常用算法?()

A.决策树算法

B.冒泡排序算法

C.聚类算法

D.关联规则算法

答案:B

解析:冒泡排序算法是基本的排序算法,不属于大数据分析常用算法,其他选项都是,所以选B。

5.大数据中数据量达到PB级别的是()

A.少量数据

B.中等数据

C.海量数据

D.超大数据

答案:C

解析:PB级别属于海量数据范畴,少量数据量小,中等数据达不到PB级别,超大数据表述不准确,所以选C。

6.大数据技术栈中负责数据处理的组件是()

A.Hive

B.HBase

C.Kafka

D.Flume

答案:A

解析:Hive用于数据处理,HBase是分布式数据库,Kafka是消息队列,Flume是日志收集工具,所以选A。

7.大数据的价值密度通常()

A.很高

B.中等

C.很低

D.不确定

答案:C

解析:大数据数据量巨大但有价值的信息相对较少,价值密度低,所以选C。

8.以下哪种数据类型不属于大数据范畴?()

A.结构化数据

B.半结构化数据

C.非结构化数据

D.简单文本数据

答案:D

解析:简单文本数据属于非结构化数据,大数据包含结构化、半结构化和非结构化数据,所以选D不合适,应选D。

9.大数据分析可以帮助企业()

A.降低成本

B.提高效率

C.精准营销

D.以上都是

答案:D

解析:大数据分析能在降低成本、提高效率、精准营销等多方面帮助企业,所以选D。

10.以下哪个是大数据可视化工具?()

A.Tableau

B.MySQL

C.Redis

D.Tomcat

答案:A

解析:Tableau是大数据可视化工具,MySQL是数据库,Redis是缓存,Tomcat是服务器,所以选A。

二、多项选择题(每题2分,共10题)

1.大数据的特点包括()

A.大量

B.多样

C.高速

D.价值密度低

答案:ABCD

解析:大数据的4V特征就是大量、多样、高速、价值密度低,所以全选。

2.大数据采集的方式有()

A.网络爬虫

B.传感器收集

C.数据库导入

D.用户上传

答案:ABCD

解析:网络爬虫可采集网页数据,传感器收集各种环境数据等,数据库导入已有数据,用户上传如上传文件等,这些都是大数据采集方式。

3.大数据分析算法中的监督学习算法有()

A.线性回归

B.逻辑回归

C.支持向量机

D.决策树

答案:ABCD

解析:这些都是监督学习算法,都需要有标记的数据来训练模型。

4.常见的大数据分布式文件系统有()

A.HDFS

B.Ceph

C.GlusterFS

D.NTFS

答案:ABC

解析:HDFS是Hadoop分布式文件系统,Ceph和GlusterFS也是常见的分布式文件系统,NTFS是Windows系统的文件系统,不属于大数据分布式文件系统。

5.大数据处理框架有()

A.Hadoop

B.Spark

C.Storm

D.Flink

答案:ABCD

解析:这些都是常用的大数据处理框架,各有特点和适用场景。

6.大数据安全面临的挑战有()

A.数据泄露

B.数据篡改

C.数据丢失

D.隐私保护

答案:ABCD

解析:大数据安全方面存在数据泄露风险,数据可能被篡改,也可能丢失,同时隐私保护也是重要挑战。

7.大数据在医疗领域的应用有()

A.疾病预测

B.医疗影像分析

C.药物研发

D.患者管理

答案:ABCD

解析:通过大数据分析可进行疾病预测,分析医疗影像,辅助药物研发,更好地管理患者。

8.大数据在教育

文档评论(0)

W小喵 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档