2026年大数据与数据挖掘基础理论试题.docxVIP

  • 0
  • 0
  • 约4.4千字
  • 约 15页
  • 2026-07-05 发布于福建
  • 举报

2026年大数据与数据挖掘基础理论试题.docx

第PAGE页共NUMPAGES页

2026年大数据与数据挖掘基础理论试题

一、单选题(每题2分,共20题)

1.在大数据处理中,下列哪项技术主要用于分布式存储和管理海量数据?

A.Hadoop

B.Spark

C.Kafka

D.TensorFlow

2.以下哪种算法属于监督学习算法?

A.K-means聚类

B.决策树

C.主成分分析(PCA)

D.Apriori关联规则

3.在数据预处理中,处理缺失值的方法不包括:

A.删除含有缺失值的记录

B.均值填充

C.回归填充

D.数据加密

4.下列哪个指标用于评估分类模型的准确性?

A.召回率(Recall)

B.F1分数

C.AUC值

D.均方误差(MSE)

5.以下哪种数据库适用于处理实时数据流?

A.关系型数据库(MySQL)

B.NoSQL数据库(MongoDB)

C.时序数据库(InfluxDB)

D.图数据库(Neo4j)

6.在大数据生态系统中,下列哪个组件主要负责数据清洗和转换?

A.HDFS

B.MapReduce

C.Hive

D.Flume

7.以下哪种模型属于非参数模型?

A.线性回归

B.逻辑回归

C.K近邻(KNN)

D.支持向量机(SVM)

8.在数据挖掘中,关联规则挖掘的常用算法是:

A.K-means

B.Apr

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档