数据挖掘笔试题及答案.docxVIP

  • 1
  • 0
  • 约3.3千字
  • 约 5页
  • 2026-03-17 发布于河北
  • 举报

数据挖掘笔试题及答案

一、选择题(每题3分,共30分)

1.下列不属于数据挖掘核心任务的是()

A.分类

B.回归

C.数据采集

D.聚类

2.在决策树算法中,用于选择最优特征的指标不包括()

A.信息增益

B.信息增益比

C.欧氏距离

D.基尼系数

3.关于K-Means聚类算法,以下说法错误的是()

A.K值需要提前设定

B.对异常值敏感

C.聚类结果一定是全局最优

D.适用于数值型数据

4.下列哪种方法可以有效处理数据中的缺失值()

A.直接删除所有缺失值所在行

B.用该特征的均值/中位数填充

C.忽略缺失值,直接建模

D.以上方法都不可以

5.逻辑回归模型的输出结果范围是()

A.(-∞,+∞)

B.[0,1]

C.(0,1)

D.[0,+∞)

6.关于过拟合,以下说法正确的是()

A.过拟合是模型在训练集上表现差,测试集上表现好

B.增加训练数据量可以缓解过拟合

C.降低模型复杂度会加重过拟合

D.过拟合只能通过正则化解决

7.下列哪种算法属于监督学习算法()

A.K-Means

B.主成分分析(PCA)

C.支持向量机(SVM)

D.关联规则挖掘(Apriori)

8.主成分分析(PCA)的核心目的是()

A.特征筛选

B.特征降维

C.特征转换

D.

文档评论(0)

1亿VIP精品文档

相关文档