NLP面试题及答案.docxVIP

  • 0
  • 0
  • 约6.92千字
  • 约 7页
  • 2026-03-12 发布于河北
  • 举报

NLP面试题及答案

一、基础概念类

1.请简单说说什么是自然语言处理?它和传统的文本处理有啥区别?

答案:自然语言处理简单说就是让计算机能理解、处理人类的自然语言(比如中文、英文),并完成沟通、分析等任务,核心是“理解语义”和“模拟交互”。传统文本处理更多是做字符层面的操作,比如分词、关键词匹配、文本检索,只停留在表面,没法理解文字背后的含义——比如“我差点没考上”和“我差点考上”,传统处理可能认为是相反的,而NLP能通过语义分析识别出两者其实都是“考上了”的意思。另外,NLP会结合语言学知识和机器学习/深度学习技术,能处理歧义、上下文关联等复杂问题,适用场景也更宽,比如对话机器人、情感分析这些。

2.什么是词向量?为什么不能直接用one-hot编码代替词向量?

答案:词向量就是把词语转换成计算机能识别的数值向量,核心是让语义相近的词,向量在空间里的距离也近(比如“苹果”和“橘子”的向量比“苹果”和“汽车”的近)。one-hot编码其实也是一种词向量的简化形式,它是用一个长度等于词表大小的向量,只有当前词语对应的位置是1,其他都是0。

不能用one-hot代替的核心原因有两个:一是维度灾难,比如词表有10万个词,one-hot向量就有10万维,计算量大还稀疏,模型很难训练;二是没有语义信息,one-hot向量里每个词都是孤立的,没法体现词语之间的关联——比如“国王”和“王后”

文档评论(0)

1亿VIP精品文档

相关文档