NLP方向面试题及详细答案(真实面试版).docxVIP

  • 1
  • 0
  • 约5.56千字
  • 约 8页
  • 2026-06-08 发布于河北
  • 举报

NLP方向面试题及详细答案(真实面试版).docx

NLP方向面试题及详细答案(真实面试版)

说明:所有答案摒弃空洞套话,贴合企业真实面试作答逻辑,侧重原理理解、区别对比、实战问题、踩坑经验,适配校招、初级/中级NLP算法岗面试。

一、NLP基础核心面试题(必问)

1、简单说说NLP中分词、词性标注、NER的区别和联系?

参考答案:

三者都是NLP基础序列标注任务,是文本理解的前置步骤,层级从基础到高阶递进。

分词是最基础的,核心是把连续的中文文本切分成独立词语,解决“句子拆单元”的问题,比如“人工智能”切分为“人工/智能”。

词性标注是在分词的基础上,给每个词语标注词性,比如名词、动词、形容词,目的是获取文本的语法基础信息,过滤无效词汇。

NER命名实体识别是更高阶的标注,在分词和词性的基础上,识别文本中具有特定意义的实体,比如人名、地名、时间、机构名,核心是提取关键业务信息。

简单来说:分词拆词语,词性标属性,NER提关键信息,大部分NLP下游任务(检索、问答、文本分类)都依赖这三个任务的预处理结果。

2、One-hot、Word2Vec、词嵌入的优缺点是什么?实战中为什么不用One-hot?

参考答案:

One-hot编码:维度等于词表大小,向量只有一个1、其余为0。优点是简单、无歧义;缺点特别明显,一是维度极高、极度稀疏,计算开销大;二是完全无法体现词语之间的语义关联,“苹果”和“香蕉”的向量相似度为0,不符合语义逻辑。实

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档