- 1
- 0
- 约7.12千字
- 约 17页
- 2026-03-30 发布于四川
- 举报
2026年数据挖掘工程师岗位考试试题及答案解析
一、单项选择题(共10题,每题2分,共20分)
1.以下哪项不属于数据挖掘的核心任务?
A.关联规则挖掘
B.数据清洗
C.分类与回归
D.聚类分析
答案:B
解析:数据清洗属于数据预处理阶段,是数据挖掘的前期步骤,而非核心任务(核心任务包括分类、回归、聚类、关联规则等)。
2.在决策树算法中,若某属性的信息增益为0.3,基尼指数减少量为0.2,则优先选择该属性分裂的依据通常是?
A.信息增益准则
B.基尼指数准则
C.二者等价
D.取决于具体数据集
答案:A
解析:信息增益和基尼指数是两种不同的分裂准则,信息增益通过熵的变化衡量,基尼指数通过不纯度变化衡量。题目未明确算法类型(如ID3用信息增益,CART用基尼指数),但默认情况下信息增益为正时优先选择信息增益准则。
3.对于不平衡数据集(正类样本占比5%),以下哪种评估指标最不适用?
A.准确率(Accuracy)
B.召回率(Recall)
C.F1值
D.AUCROC
答案:A
解析:准确率在正负样本极不平衡时会被多数类主导(如全部预测为负类时准确率可达95%),无法有效反映模型对正类的识别能力。
4.以下哪种特征工程方法用于解决“维度灾难”问题?
A.
原创力文档

文档评论(0)