2026年自然语言处理工程师考试题库（附答案和详细解析）（0226）.docxVIP

2026年自然语言处理工程师考试题库（附答案和详细解析）（0226）.docx

自然语言处理工程师考试试卷

一、单项选择题（共10题，每题1分，共10分）

以下哪项是Word2Vec模型的核心训练目标？

A.预测句子的下一个词

B.基于上下文预测中心词或基于中心词预测上下文

C.学习句子级别的语义表示

D.解决长距离依赖问题

答案：B

解析：Word2Vec包含两种训练模式：CBOW（连续词袋模型）通过上下文词预测中心词，Skip-gram通过中心词预测上下文词。选项A是语言模型（如GPT）的目标；选项C是句子嵌入（如Sentence-BERT）的目标；选项D是LSTM/Transformer的优势，故正确答案为B。

BERT模型的预训练任务不包括以下哪项？

A.掩码语言模型（MLM）

B.下一句预测（NSP）

C.填空任务（ClozeTask）

D.机器翻译（MT）

答案：D

解析：BERT的预训练任务是MLM（随机掩码部分输入词并预测）和NSP（判断两句话是否连续）。选项C是MLM的具体实现形式；选项D是下游任务而非预训练任务，故正确答案为D。

中文分词中，基于统计的方法（如HMM/CRF）与基于规则的方法最本质的区别是？

A.是否需要人工标注语料

B.是否利用上下文概率

C.是否依赖词典

D.是否处理歧义切分

答案：B

解析：统计方法（如HMM/CRF）通过训练语料学习词边界的概率分布，而规则方法依赖人工总结的切分规则（如“正向

更多 >