- 2
- 0
- 约5.55千字
- 约 14页
- 2026-04-01 发布于福建
- 举报
第PAGE页共NUMPAGES页
2026年数据挖掘面试题及机器学习含答案
一、选择题(每题2分,共10题)
1.在处理缺失值时,以下哪种方法不属于常用的插补方法?
A.均值插补
B.回归插补
C.K最近邻插补
D.主成分分析插补
2.在特征选择中,以下哪种方法适用于高维稀疏数据?
A.Lasso回归
B.决策树
C.线性回归
D.K-Means聚类
3.在模型评估中,当数据集类别不平衡时,以下哪个指标更适合评估模型性能?
A.准确率(Accuracy)
B.精确率(Precision)
C.召回率(Recall)
D.F1分数
4.以下哪种算法属于非监督学习算法?
A.逻辑回归
B.支持向量机
C.K-Means聚类
D.线性判别分析
5.在自然语言处理中,以下哪种模型常用于文本分类任务?
A.卷积神经网络(CNN)
B.长短时记忆网络(LSTM)
C.朴素贝叶斯
D.生成对抗网络(GAN)
二、填空题(每空1分,共5题)
1.在交叉验证中,K折交叉验证是指将数据集分成K个子集,每次留出一个子集作为测试集,其余作为训练集,重复K次,最终取平均性能。
(答案:K)
2.在决策树中,信息增益是衡量特征重要性的常用指标,其计算公式为:信息增益=信息熵(父节点)-Σ((子节点占比×子节点信息熵))。
(答案:
您可能关注的文档
最近下载
- 出入境管理法培训课件.ppt VIP
- 2025年西藏中考地理真题卷含答案解析.docx VIP
- 2025年西藏中考地理试卷试题真题(含答案详解).pdf VIP
- Shanhe Star Aviation Co., Ltd.用户手册Aurora SA60L Aurora SA60L-iS说明书.pdf
- 03中铁债:中国国家铁路集团有限公司2020年年度报告.PDF VIP
- 《中国铁路总公司铁路建设项目档案管理办法》1.pdf VIP
- 2009年国家三、四等水准测量规范.pdf VIP
- 基于51单片机的水质检测系统设计_毕业设计.doc VIP
- JB-TT-JBF-11SF、JB-TG-JBF-11SF火灾报警控制器(联动型)使用说明书-北大青鸟.pdf
- GB50026-2020 工程测量标准.pdf VIP
原创力文档

文档评论(0)