2026年数据挖掘工程师知识考试试题及答案解析.docxVIP

  • 0
  • 0
  • 约6.36千字
  • 约 15页
  • 2026-03-28 发布于四川
  • 举报

2026年数据挖掘工程师知识考试试题及答案解析.docx

2026年数据挖掘工程师知识考试试题及答案解析

一、单项选择题(每题2分,共20分)

1.以下哪种方法最适合处理高维稀疏的类别特征?

A.标准化(Zscore)

B.独热编码(OneHotEncoding)

C.对数变换(LogTransformation)

D.主成分分析(PCA)

2.在决策树算法中,C4.5算法相较于ID3算法的主要改进是?

A.使用信息增益比替代信息增益

B.支持连续型特征离散化

C.引入剪枝策略防止过拟合

D.同时支持分类与回归任务

3.以下哪项指标用于衡量聚类算法的“类内紧凑性”与“类间分离性”?

A.轮廓系数(SilhouetteCoefficient)

B.调整兰德指数(AdjustedRandIndex)

C.F1score

D.AUCROC

4.在关联规则挖掘中,若某规则“啤酒→尿布”的支持度为15%,置信度为60%,则以下说法正确的是?

A.所有购物篮中,同时包含啤酒和尿布的比例为15%

B.包含啤酒的购物篮中,有60%也包含尿布

C.包含尿布的购物篮中,有60%也包含啤酒

D.该规则的提升度(Lift)一定大于1

5.对于不平衡数据集(正类占比5%),以下哪种评估指标最不适用?

A.准确率(Accur

文档评论(0)

1亿VIP精品文档

相关文档