2026年自然语言处理工程师考试题库（附答案和详细解析）（0202）.docxVIP

下载本文档

8
0
约9.44千字
约 12页
2026-04-28 发布于江苏
举报

2026年自然语言处理工程师考试题库（附答案和详细解析）（0202）.docx

自然语言处理工程师考试试卷

一、单项选择题（共10题，每题1分，共10分）

以下哪项是Word2Vec模型的核心训练目标？

A.预测当前词的词类标注

B.最大化上下文词与目标词的共现概率

C.分类文本的情感倾向

D.生成符合语法的句子

答案：B

解析：Word2Vec的核心是通过滑动窗口获取上下文词与中心词的共现关系，训练目标是最大化上下文词与目标词的联合概率（Skip-gram模型）或目标词对上下文的预测概率（CBOW模型）。选项A是词性标注任务目标，C是情感分析任务目标，D是语言生成任务目标，均不符合Word2Vec的训练目标。

以下哪种模型属于生成式预训练模型？

A.BERT

B.GPT

C.RoBERTa

D.ALBERT

答案：B

解析：GPT（GenerativePre-trainedTransformer）是典型的生成式预训练模型，采用自回归（Autoregressive）训练方式，通过前向文本预测下一个词。BERT、RoBERTa、ALBERT均为判别式预训练模型，采用自编码（Autoencoding）训练方式（如掩码语言模型）。

中文分词中的“歧义切分”主要指？

A.分词工具无法处理生僻词

B.同一文本存在多种合理的切分方式

C.分词结果中出现标点符号

D.分词速度过慢影响实时性

答案：B

解析：歧义切分是中文分词的核心难点之一，指同一

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

2026年自然语言处理工程师考试题库（附答案和详细解析）（0202）.docxVIP