2025年高频高强度的面试试题及答案.docxVIP

下载本文档

2
0
约6.81千字
约 13页
2026-05-01 发布于四川
举报

2025年高频高强度的面试试题及答案.docx

2025年高频高强度的面试试题及答案

一、技术研发类（AI/大数据方向）

1.问题：在大语言模型（LLM）微调过程中，若出现模型对训练集过拟合但验证集效果不佳的情况，你会从哪些维度排查问题？请结合具体技术方案说明。

答案：首先检查数据层面：①训练集与验证集分布是否一致，通过KL散度或统计特征（如token频率、句子长度）对比，若存在分布偏移，需重新划分或用数据增强平衡；②验证集样本量是否不足（如小于总数据5%），建议扩大验证集至10%-15%并分层抽样；③训练数据是否存在标签噪声，可通过交叉验证筛选高置信度样本或引入主动学习人工复核。其次模型层面：①微调策略是否过于激进（如全参数微调而非LoRA/Adapter），若使用全参数微调，可尝试降低学习率（如从2e-5降至1e-5）或增加早停机制（验证集loss连续3轮不下降则停止）；②正则化是否不足，添加Dropout（如从0.1增至0.3）或权重衰减（L2正则系数从1e-4调至1e-3）；③评估指标是否与业务目标脱节（如用准确率而非F1-score），需根据实际场景（如长文本提供用BLEU+ROUGE组合）调整指标。最后训练过程：①批次大小是否过小（如16）导致梯度估计不稳定，建议增大至32-64并配合梯度累积；②学习率调度是否不合理（如无warmup直接衰减），采用线性warmup（前10%步数）+余弦衰减策

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

2025年高频高强度的面试试题及答案.docxVIP