大数据培训试题及答案.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

大数据培训试题及答案

一、单选题(每题1分,共10分)

1.大数据通常指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,其体积是()(1分)

A.小于1GBB.1GB-10GBC.10GB-100GBD.超过100GB

【答案】D

【解析】大数据的体积通常超过100GB。

2.下列哪种技术不属于大数据处理技术?()(1分)

A.HadoopB.SparkC.MongoDBD.MySQL

【答案】D

【解析】MySQL是传统的关系型数据库管理系统,不属于大数据处理技术。

3.大数据的特点不包括()(1分)

A.海量性B.速度性C.多样性D.稳定性

【答案】D

【解析】大数据的特点包括海量性、速度性、多样性和价值性。

4.以下哪个不是大数据的来源?()(1分)

A.日志文件B.社交媒体C.传感器数据D.传统数据库

【答案】D

【解析】传统数据库不属于大数据的来源。

5.下列哪种存储方式不适合大数据存储?()(1分)

A.分布式文件系统B.NoSQL数据库C.关系型数据库D.云存储

【答案】C

【解析】关系型数据库不适合存储大数据。

6.大数据技术中,HDFS的中文全称是()(1分)

A.HadoopDistributedFileSystemB.HyperDatabaseFileSystemC.High-DefinitionFileSystemD.HugeDataFileSystem

【答案】A

【解析】HDFS的中文全称是Hadoop分布式文件系统。

7.下列哪种算法不属于机器学习算法?()(1分)

A.决策树B.神经网络C.回归分析D.K-means聚类

【答案】C

【解析】回归分析属于统计方法,不属于机器学习算法。

8.大数据时代,数据挖掘的主要目的是()(1分)

A.数据存储B.数据分析C.数据传输D.数据备份

【答案】B

【解析】数据挖掘的主要目的是数据分析。

9.下列哪种工具不属于数据可视化工具?()(1分)

A.TableauB.PowerBIC.ExcelD.TensorFlow

【答案】D

【解析】TensorFlow是机器学习框架,不属于数据可视化工具。

10.大数据技术中,Spark的中文全称是()(1分)

A.SparkAdvancedProcessingKitB.SparkAdvancedProgrammingKitC.SparkAdvancedProcessingKernelD.SparkAdvancedProgrammingKernel

【答案】C

【解析】Spark的中文全称是Spark高级处理内核。

二、多选题(每题4分,共20分)

1.以下哪些属于大数据的特点?()(4分)

A.海量性B.速度性C.多样性D.价值性E.稳定性

【答案】A、B、C、D

【解析】大数据的特点包括海量性、速度性、多样性和价值性。

2.以下哪些技术属于大数据处理技术?()(4分)

A.HadoopB.SparkC.MongoDBD.MySQLE.Elasticsearch

【答案】A、B、C、E

【解析】Hadoop、Spark、MongoDB和Elasticsearch属于大数据处理技术。

3.以下哪些属于大数据的来源?()(4分)

A.日志文件B.社交媒体C.传感器数据D.传统数据库E.移动设备数据

【答案】A、B、C、E

【解析】大数据的来源包括日志文件、社交媒体、传感器数据和移动设备数据。

4.以下哪些属于数据可视化工具?()(4分)

A.TableauB.PowerBIC.ExcelD.TensorFlowE.D3.js

【答案】A、B、C、E

【解析】Tableau、PowerBI、Excel和D3.js属于数据可视化工具。

5.以下哪些属于机器学习算法?()(4分)

A.决策树B.神经网络C.回归分析D.K-means聚类E.支持向量机

【答案】A、B、D、E

【解析】决策树、神经网络、K-means聚类和支持向量机属于机器学习算法。

三、填空题(每题2分,共16分)

1.大数据通常指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,其体量通常达到______以上。(2分)

【答案】10GB

【解析】大数据的体量通常达到10GB以上。

2.Hadoop是一个开源的分布式计算框架,主要由______和______两部分组成。(2分)

【答案】HDFS;MapReduce

【解析】Hadoop主要由HDFS和MapReduce两部分组成。

3.大数据的特点包括______、______、______和______。(4分)

【答案】海量性;速度性;多样性;价值性

【解析】大数据的特点包括海量性、速度性、多样性和价值性。

4.机器学习算法中,常用的分类算法有______和_____

文档评论(0)

155****6593 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档