2026年数据挖掘面试题及机器学习含答案.docxVIP

  • 2
  • 0
  • 约5.55千字
  • 约 14页
  • 2026-04-01 发布于福建
  • 举报

2026年数据挖掘面试题及机器学习含答案.docx

第PAGE页共NUMPAGES页

2026年数据挖掘面试题及机器学习含答案

一、选择题(每题2分,共10题)

1.在处理缺失值时,以下哪种方法不属于常用的插补方法?

A.均值插补

B.回归插补

C.K最近邻插补

D.主成分分析插补

2.在特征选择中,以下哪种方法适用于高维稀疏数据?

A.Lasso回归

B.决策树

C.线性回归

D.K-Means聚类

3.在模型评估中,当数据集类别不平衡时,以下哪个指标更适合评估模型性能?

A.准确率(Accuracy)

B.精确率(Precision)

C.召回率(Recall)

D.F1分数

4.以下哪种算法属于非监督学习算法?

A.逻辑回归

B.支持向量机

C.K-Means聚类

D.线性判别分析

5.在自然语言处理中,以下哪种模型常用于文本分类任务?

A.卷积神经网络(CNN)

B.长短时记忆网络(LSTM)

C.朴素贝叶斯

D.生成对抗网络(GAN)

二、填空题(每空1分,共5题)

1.在交叉验证中,K折交叉验证是指将数据集分成K个子集,每次留出一个子集作为测试集,其余作为训练集,重复K次,最终取平均性能。

(答案:K)

2.在决策树中,信息增益是衡量特征重要性的常用指标,其计算公式为:信息增益=信息熵(父节点)-Σ((子节点占比×子节点信息熵))。

(答案:

文档评论(0)

1亿VIP精品文档

相关文档