大数据导论(第二版):大数据应用.docxVIP

  • 2
  • 0
  • 约6.61千字
  • 约 12页
  • 2026-04-26 发布于湖南
  • 举报

大数据导论(第二版):大数据应用

一、单选题(每题2分,共20分)

1.下列哪项不是大数据的4V特征?()(2分)

A.数据量大B.速度快C.价值密度高D.多样性少

【答案】D

【解析】大数据的4V特征包括:数据量大(Volume)、速度快(Velocity)、价值密度低(Value)、多样性(Variety)。

2.以下哪个工具主要用于分布式存储?()(2分)

A.MySQLB.HadoopHDFSC.PandasD.Elasticsearch

【答案】B

【解析】Hadoop分布式文件系统(HDFS)是Hadoop项目的一部分,专门用于大规模数据集的分布式存储。

3.大数据分析中的批处理主要处理哪种类型的数据?()(2分)

A.实时数据B.历史数据C.流数据D.交互数据

【答案】B

【解析】批处理主要处理大规模的历史数据集,而实时数据处理的是流数据。

4.以下哪个算法不属于机器学习中的监督学习?()(2分)

A.决策树B.线性回归C.K-means聚类D.逻辑回归

【答案】C

【解析】K-means聚类属于无监督学习算法,而决策树、线性回归和逻辑回归都属于监督学习算法。

5.大数据应用中,哪个技术主要用于数据挖掘?()(2分)

A.ETLB.SparkC.MahoutD.Kafka

【答案】C

【解析】Mahout是一个基于Hadoop的机器学习库,主要用于数据挖掘和大规模数据

文档评论(0)

1亿VIP精品文档

相关文档