2026年数据挖掘工程师岗位考试试题及答案解析.docxVIP

  • 1
  • 0
  • 约7.12千字
  • 约 17页
  • 2026-03-30 发布于四川
  • 举报

2026年数据挖掘工程师岗位考试试题及答案解析.docx

2026年数据挖掘工程师岗位考试试题及答案解析

一、单项选择题(共10题,每题2分,共20分)

1.以下哪项不属于数据挖掘的核心任务?

A.关联规则挖掘

B.数据清洗

C.分类与回归

D.聚类分析

答案:B

解析:数据清洗属于数据预处理阶段,是数据挖掘的前期步骤,而非核心任务(核心任务包括分类、回归、聚类、关联规则等)。

2.在决策树算法中,若某属性的信息增益为0.3,基尼指数减少量为0.2,则优先选择该属性分裂的依据通常是?

A.信息增益准则

B.基尼指数准则

C.二者等价

D.取决于具体数据集

答案:A

解析:信息增益和基尼指数是两种不同的分裂准则,信息增益通过熵的变化衡量,基尼指数通过不纯度变化衡量。题目未明确算法类型(如ID3用信息增益,CART用基尼指数),但默认情况下信息增益为正时优先选择信息增益准则。

3.对于不平衡数据集(正类样本占比5%),以下哪种评估指标最不适用?

A.准确率(Accuracy)

B.召回率(Recall)

C.F1值

D.AUCROC

答案:A

解析:准确率在正负样本极不平衡时会被多数类主导(如全部预测为负类时准确率可达95%),无法有效反映模型对正类的识别能力。

4.以下哪种特征工程方法用于解决“维度灾难”问题?

A.

文档评论(0)

1亿VIP精品文档

相关文档