【2025年】数据挖掘考试题及答案.docxVIP

  • 0
  • 0
  • 约7.29千字
  • 约 19页
  • 2026-04-26 发布于四川
  • 举报

【2025年】数据挖掘考试题及答案

一、单项选择题(每题2分,共20分)

1.以下哪种数据预处理方法最适用于处理时间序列数据中的周期性缺失值?

A.均值填补法

B.线性插值法

C.热卡填补法

D.随机森林预测填补法

答案:B

2.在关联规则挖掘中,若某规则“牛奶→面包”的支持度为15%,置信度为80%,则以下表述正确的是?

A.所有购买牛奶的用户中80%购买了面包

B.所有购买面包的用户中15%同时购买了牛奶

C.所有购物篮中15%同时包含牛奶和面包,且其中80%的购物篮在包含牛奶时也包含面包

D.所有购物篮中15%包含牛奶,其中80%包含面包

答案:C

3.以下分类算法中,对类别不平衡数据最敏感的是?

A.逻辑回归

B.随机森林

C.SVM(支持向量机)

D.KNN(K近邻)

答案:C(SVM的优化目标是最大化间隔,少数类样本可能被忽略)

4.在K-means聚类中,若初始质心选择不当,最可能导致的问题是?

A.算法无法收敛

B.聚类结果陷入局部最优

C.计算复杂度显著增加

D.对噪声数据过度敏感

答案:B

5.信息增益(InformationGain)的计算基于以下哪个指标?

A.基尼系数(GiniIndex)

B.熵(Entrop

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档