模型面试题及详细答案.docxVIP

  • 0
  • 0
  • 约8.85千字
  • 约 9页
  • 2026-05-01 发布于河北
  • 举报

模型面试题及详细答案

一、基础必考题(入门级,考察核心概念掌握)

1.请说说什么是过拟合、欠拟合,以及实际工作中你是怎么解决这两个问题的?

答案:首先说过拟合,简单讲就是模型“学太细”了,把训练数据里的噪声、偶然误差都当成了规律,导致在训练集上效果很好,一到测试集或者新数据上就拉胯,泛化能力差。比如用简单的线性回归去拟合复杂数据,硬要追求训练集准确率100%,最后曲线拐来拐去,完全贴合训练数据的每个点,但对新数据预测不准。

欠拟合则相反,是模型“学不够”,连训练数据里的基本规律都没抓住,训练集和测试集效果都不好。比如用线性模型去拟合非线性数据(比如房价和面积的二次关系),模型只能画一条直线,根本贴合不了数据趋势,误差一直很大。

实际解决方法(不套理论,说实操):

解决过拟合:①最常用的是正则化,L1正则化会让部分特征系数变0,相当于做特征选择,避免冗余特征;L2正则化会让系数变小,不让某个特征权重过高,实际中我常用L2(比如逻辑回归里的Ridge)。②增加训练数据,比如数据增强(图像类就翻转、裁剪,文本类就同义词替换),数据量够大,模型就不容易学偏。③早停,训练的时候盯着验证集效果,一旦验证集准确率不提升甚至下降,就停止训练,不让模型继续“死记硬背”训练数据。④简化模型,比如把复杂的深度神经网络层数减少,或者把决策树的深度剪枝,去掉没必要的分支。

解决欠拟合:①增加

文档评论(0)

1亿VIP精品文档

相关文档