(2025年)数据挖掘试卷及答案.docxVIP

  • 1
  • 0
  • 约3.73千字
  • 约 11页
  • 2026-05-09 发布于四川
  • 举报

(2025年)数据挖掘试卷及答案

一、单项选择题(每题2分,共20分)

1.以下哪项不属于数据清洗的常见任务?

A.处理缺失值

B.消除重复数据

C.计算特征间的相关系数

D.修正噪声数据

2.在关联规则挖掘中,若某规则的支持度为0.3,置信度为0.8,且提升度为1.2,则以下表述正确的是?

A.该规则的提升度大于1,说明规则有效

B.支持度0.3表示30%的事务同时包含前件和后件

C.置信度0.8表示后件出现时前件出现的概率为80%

D.提升度=支持度/(前件支持度×后件支持度)

3.决策树算法中,若某节点的信息熵为1.5,分割后两个子节点的条件熵分别为0.8(权重0.6)和0.9(权重0.4),则信息增益为?

A.1.5(0.8×0.6+0.9×0.4)=0.46

B.1.5(0.8+0.9)/2=0.55

C.(0.8×0.6+0.9×0.4)1.5=-1.04

D.1.5max(0.8,0.9)=0.6

4.关于K-means聚类算法,以下说法错误的是?

A.初始质心的选择会影响最终聚类结果

B.适用于非凸形状的簇

C.需预先指定聚类数k

D.对离群点敏感

5.以下哪项是衡量分类模型“查全率”(Recall)的公式?

A.TP/

文档评论(0)

1亿VIP精品文档

相关文档