2026年数据挖掘与分析方法课程的在线考试试卷及答案.docxVIP

  • 1
  • 0
  • 约6.02千字
  • 约 14页
  • 2026-03-28 发布于四川
  • 举报

2026年数据挖掘与分析方法课程的在线考试试卷及答案.docx

2026年数据挖掘与分析方法课程的在线考试试卷及答案

一、单项选择题(每题2分,共20分)

1.以下哪项不属于数据清洗的典型任务?

A.处理缺失值

B.消除重复数据

C.标准化数据范围

D.检测并修正异常值

答案:C(标准化属于数据变换,非清洗任务)

2.在决策树算法中,若某属性的信息增益为0.3,基尼指数减少量为0.2,则优先选择该属性的分裂准则是?

A.ID3算法

B.C4.5算法

C.CART算法

D.随机森林

答案:A(ID3基于信息增益,CART基于基尼指数)

3.Kmeans聚类中,若初始质心选择不当,最可能导致的问题是?

A.计算复杂度显著增加

B.陷入局部最优解

C.聚类结果不满足凸性

D.无法处理高维数据

答案:B(Kmeans对初始质心敏感,易受局部最优影响)

4.关联规则挖掘中,若规则X→Y的支持度为0.15,置信度为0.8,且Y的支持度为0.2,则提升度(Lift)为?

A.0.15×0.8

B.0.8/0.2

C.0.15/(0.2×0.15)

D.0.8×0.2

答案:B(Lift=置信度/支持度(Y))

5.在逻辑回归模型中,若某特征的系数为2.5,其实际含义是?

A.该特征每增加1单位,对数几率减少2.5

B.该特征每增加1单位,概率减少

文档评论(0)

1亿VIP精品文档

相关文档