2025年公需科目《大数据》完整考试题库(含标准答案).docxVIP

  • 1
  • 0
  • 约4.91千字
  • 约 16页
  • 2026-05-08 发布于四川
  • 举报

2025年公需科目《大数据》完整考试题库(含标准答案).docx

2025年公需科目《大数据》完整考试题库(含标准答案)

一、单项选择题(每题2分,共40分)

1.下列哪项不属于大数据的“4V”特征?

A.大量(Volume)

B.高速(Velocity)

C.多样(Variety)

D.高价(Valuable)

答案:D

2.以下哪种技术是Hadoop分布式文件系统的核心组件?

A.HBase

B.Hive

C.HDFS

D.Spark

答案:C

3.数据挖掘中,用于发现数据中频繁出现的模式或关联规则的算法是?

A.聚类算法(如Kmeans)

B.分类算法(如决策树)

C.关联规则挖掘(如Apriori)

D.回归分析

答案:C

4.数据湖(DataLake)与数据仓库(DataWarehouse)的主要区别在于?

A.数据湖仅存储结构化数据,数据仓库存储非结构化数据

B.数据湖存储原始数据,数据仓库存储经过清洗和转换的数据

C.数据湖用于实时分析,数据仓库用于历史分析

D.数据湖规模更小,数据仓库规模更大

答案:B

5.分布式计算框架Spark的核心是?

A.RDD(弹性分布式数据集)

B.MapReduce

C.HDFS

D.YARN

答案:A

6.以下哪项技术用于解决大数据

文档评论(0)

1亿VIP精品文档

相关文档