- 0
- 0
- 约8.85千字
- 约 9页
- 2026-05-01 发布于河北
- 举报
模型面试题及详细答案
一、基础必考题(入门级,考察核心概念掌握)
1.请说说什么是过拟合、欠拟合,以及实际工作中你是怎么解决这两个问题的?
答案:首先说过拟合,简单讲就是模型“学太细”了,把训练数据里的噪声、偶然误差都当成了规律,导致在训练集上效果很好,一到测试集或者新数据上就拉胯,泛化能力差。比如用简单的线性回归去拟合复杂数据,硬要追求训练集准确率100%,最后曲线拐来拐去,完全贴合训练数据的每个点,但对新数据预测不准。
欠拟合则相反,是模型“学不够”,连训练数据里的基本规律都没抓住,训练集和测试集效果都不好。比如用线性模型去拟合非线性数据(比如房价和面积的二次关系),模型只能画一条直线,根本贴合不了数据趋势,误差一直很大。
实际解决方法(不套理论,说实操):
解决过拟合:①最常用的是正则化,L1正则化会让部分特征系数变0,相当于做特征选择,避免冗余特征;L2正则化会让系数变小,不让某个特征权重过高,实际中我常用L2(比如逻辑回归里的Ridge)。②增加训练数据,比如数据增强(图像类就翻转、裁剪,文本类就同义词替换),数据量够大,模型就不容易学偏。③早停,训练的时候盯着验证集效果,一旦验证集准确率不提升甚至下降,就停止训练,不让模型继续“死记硬背”训练数据。④简化模型,比如把复杂的深度神经网络层数减少,或者把决策树的深度剪枝,去掉没必要的分支。
解决欠拟合:①增加
您可能关注的文档
最近下载
- 【推荐下载】人教精通版小学英语3-6年级单词词汇表(最新整理).最新.pdf VIP
- 日立电梯MCA电气原理图纸K3500501 1600KG 2018-11-1.pdf
- 零售药店每月培训计划和培训内容.docx VIP
- 《特灵CTV机组的结构与工作原理》.ppt VIP
- 特灵CVHG离心机组结构和原理介绍.ppt VIP
- 无症状高尿酸血症合并心血管疾病诊治建议中国专家共识解读.PPT VIP
- 公务员录用体检通用标准(试行)(2016修订版).docx VIP
- 基于单片机的水质监测系统的设计.doc VIP
- 无症状高尿酸血症合并心血管疾病诊治建议中国专家共识(下).pptx
- 2025年湖北普通高中学业水平选择性考试地理真题及答案 .pdf VIP
原创力文档

文档评论(0)