NLP面试高频题及参考答案.docxVIP

下载本文档

1
0
约2.72千字
约 3页
2025-11-14 发布于河北
举报
版权申诉

NLP面试高频题及参考答案.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

NLP面试高频题及参考答案

一、基础概念类（考察核心认知）

问题：请用通俗的话解释“词向量”，并说明它解决了传统文本表示的什么问题？

参考答案：词向量就是把词语转换成计算机能理解的数字向量（比如一串浮点数），核心是让“意思相近的词，向量也相近”。传统方法比如One-Hot编码，每个词都是独立的“孤立向量”，既浪费空间（词汇量大时向量维度爆炸），又没法体现词语间的关联（比如“苹果”和“香蕉”在One-Hot里毫无关系）；而词向量能捕捉这种语义关联，比如“国王-男人+女人≈女王”，这是传统方法做不到的。

问题：什么是“分词歧义”？举一个中文分词歧义的例子，并说说常见的解决思路。

参考答案：分词歧义就是一句话有多种合理的切分方式。比如“南京市长江大桥”，可以切“南京市/长江大桥”，也可以切“南京/市长/江大桥”。解决思路主要有两种：一是基于规则（比如人工制定优先匹配长词的规则，优先识别“南京市”“长江大桥”这类常用长词组）；二是基于统计（用模型学习大量文本中词语的共现概率，比如“南京市”和“长江大桥”一起出现的概率远高于“南京”“市长”“江大桥”，所以选概率高的切分方式）。

问题：简述“BLEU分数”的作用，以及它的核心计算逻辑（不用公式，用文字描述）。

参考答案：BLEU分数是用来评估机器翻译结果好不好的指标。核心逻辑是“看机器翻译的句子，和人类翻译的参考句重合度有多高”。具体来说，会统计翻译句中n个连续词语（比如1个词、2个词的词组）在参考句中出现的次数，再做一些调整（比如避免机器只重复写一个高频词凑数），最后算出一个0-1之间的分数，分数越高说明和参考句越贴近。

二、技术应用类（考察实操理解）

问题：如果让你做一个“文本分类”任务（比如判断新闻是体育类还是财经类），你会怎么设计整体流程？

参考答案：第一步先做数据预处理，比如清洗文本（去掉标点、特殊符号、无意义的停用词如“的、了、是”）、分词（中文分词、英文分词+词形还原）；第二步是文本表示，比如用TF-IDF把文本转换成向量，或者用预训练词向量（如Word2Vec）拼接成句子向量；第三步选模型，简单场景用逻辑回归、SVM，复杂场景用CNN、BERT；第四步模型训练与评估，划分训练集/测试集，用准确率、召回率、F1分数评估效果，根据结果调参（比如调整词向量维度、模型的学习率）；最后部署上线，处理实时文本输入。

问题：预训练模型（比如BERT）为什么能在很多NLP任务上表现很好？它和传统的神经网络模型（比如CNN、RNN）相比，核心优势是什么？

参考答案：核心原因是预训练模型“先学了大量通用的语言知识，再适配具体任务”。它在海量文本上先进行预训练，学到了词语的语义关联、语法结构、上下文依赖（比如“他喜欢吃苹果，它很甜”里的“它”指代“苹果”），相当于已经有了“语言基础”；而传统模型是在具体任务的小数据集上从头训练，很难学到这些通用知识。和CNN、RNN相比，优势一是能捕捉“双向上下文”，RNN是单向的（只能看前面的词或后面的词），CNN靠卷积捕捉局部特征，而BERT的自注意力机制能同时关注句子中所有词的关联；二是参数共享且迁移能力强，预训练好的模型只要做少量调整（比如加个分类层），就能适配分类、问答等不同任务，不用每个任务都重新设计模型。

问题：在做“情感分析”（比如判断用户评论是正面还是负面）时，遇到哪些常见问题？怎么解决？

参考答案：常见问题有三个：一是歧义句（比如“这款手机性能不错，但续航太拉胯了”，混合正负情感）；二是口语化/网络用语（比如“YYDS”“绝绝子”“踩雷”，传统词向量可能不认识）；三是领域差异（比如“这个医生很‘硬’”，在医疗领域是褒义，在其他领域可能是贬义）。解决办法：针对歧义句，用细粒度情感分析（识别句子中不同部分的情感，再综合判断）；针对口语/网络用语，扩充词表，把这些词加入词向量训练，或用专门处理口语的预训练模型；针对领域差异，用领域内的语料做微调（比如用医疗评论数据微调BERT），让模型适应特定领域的语义。

三、工程实践类（考察落地能力）

问题：如果你的NLP模型在测试集上准确率很高，但上线后实际效果很差，可能是什么原因？怎么排查？

参考答案：核心原因是“测试集和真实场景的数据分布不一致”。排查步骤：第一步先分析线上错误案例，看是哪类文本预测错了（比如测试集里没有的口语化文本、领域外文本）；第二步检查数据标注是否有问题（比如测试集标注错误，导致模型“伪高分”）；第三步看是否有数据泄露（比如训练集和测试集有重复文本，模型相当于“作弊”）；第四步验证线上数据的预处理是否和训练时