数据挖掘期末考试题目及答案.docxVIP

  • 0
  • 0
  • 约5.14千字
  • 约 13页
  • 2026-04-01 发布于四川
  • 举报

数据挖掘期末考试题目及答案

一、单项选择题(每题2分,共10分)

1.以下哪项不属于数据清洗的主要任务?

A.处理缺失值

B.消除重复数据

C.计算特征间的相关系数

D.纠正数据中的错误值

2.在Apriori算法中,若最小支持度设为0.3,某2项集的支持度计数为6,数据库事务总数为20,则该2项集是否满足支持度要求?

A.是(支持度=0.3)

B.否(支持度=0.25)

C.是(支持度=0.25)

D.否(支持度=0.3)

3.决策树算法中,信息增益的计算基于以下哪个指标的变化?

A.基尼系数

B.信息熵

C.均方误差

D.余弦相似度

4.Kmeans聚类算法的核心目标是最小化:

A.类内样本与质心的欧氏距离平方和

B.类间样本的曼哈顿距离和

C.所有样本的轮廓系数

D.不同类质心的马氏距离

5.在分类模型评估中,若某模型在测试集上的真阳性率(TPR)为0.8,假阳性率(FPR)为0.2,则对应的ROC曲线下面积(AUC)最可能为:

A.0.5

B.0.6

C.0.8

D.1.0

二、多项选择题(每题3分,共15分,错选、漏选均不得分)

1.以下属于数据预处理步骤的有:

A.特征标准化

B.关联规则挖掘

C.离

文档评论(0)

1亿VIP精品文档

相关文档