- 0
- 0
- 约6.92千字
- 约 7页
- 2026-03-12 发布于河北
- 举报
NLP面试题及答案
一、基础概念类
1.请简单说说什么是自然语言处理?它和传统的文本处理有啥区别?
答案:自然语言处理简单说就是让计算机能理解、处理人类的自然语言(比如中文、英文),并完成沟通、分析等任务,核心是“理解语义”和“模拟交互”。传统文本处理更多是做字符层面的操作,比如分词、关键词匹配、文本检索,只停留在表面,没法理解文字背后的含义——比如“我差点没考上”和“我差点考上”,传统处理可能认为是相反的,而NLP能通过语义分析识别出两者其实都是“考上了”的意思。另外,NLP会结合语言学知识和机器学习/深度学习技术,能处理歧义、上下文关联等复杂问题,适用场景也更宽,比如对话机器人、情感分析这些。
2.什么是词向量?为什么不能直接用one-hot编码代替词向量?
答案:词向量就是把词语转换成计算机能识别的数值向量,核心是让语义相近的词,向量在空间里的距离也近(比如“苹果”和“橘子”的向量比“苹果”和“汽车”的近)。one-hot编码其实也是一种词向量的简化形式,它是用一个长度等于词表大小的向量,只有当前词语对应的位置是1,其他都是0。
不能用one-hot代替的核心原因有两个:一是维度灾难,比如词表有10万个词,one-hot向量就有10万维,计算量大还稀疏,模型很难训练;二是没有语义信息,one-hot向量里每个词都是孤立的,没法体现词语之间的关联——比如“国王”和“王后”
您可能关注的文档
最近下载
- 工地实验室标准化建后所有表格==最新试验用表目录及说明.doc VIP
- 2026年广告预算分配策略与ROI提升路径分析报告.docx
- 垃圾运输应急预案.docx VIP
- 党风廉政建设应知应会知识测试题库(新522题).docx VIP
- 安徽省C20教育联盟2026年九年级第一次学业水平检测政治试卷.pdf VIP
- 肛管直肠超声检查中国专家共识(2024版) .pdf VIP
- 东南大学田玉平自控原理参考答案20001.docx VIP
- 垃圾填埋场应急预案.pdf VIP
- 市政管网燃气管道工程沿公路敷设保障公路、公路附属设施安全评价报告.doc VIP
- 安徽省C20教育联盟2026年九年级第一次学业水平检测历史试卷.pdf VIP
原创力文档

文档评论(0)