2026年自然语言处理工程师考试题库(附答案和详细解析)(0202).docxVIP

  • 8
  • 0
  • 约9.44千字
  • 约 12页
  • 2026-04-28 发布于江苏
  • 举报

2026年自然语言处理工程师考试题库(附答案和详细解析)(0202).docx

自然语言处理工程师考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪项是Word2Vec模型的核心训练目标?

A.预测当前词的词类标注

B.最大化上下文词与目标词的共现概率

C.分类文本的情感倾向

D.生成符合语法的句子

答案:B

解析:Word2Vec的核心是通过滑动窗口获取上下文词与中心词的共现关系,训练目标是最大化上下文词与目标词的联合概率(Skip-gram模型)或目标词对上下文的预测概率(CBOW模型)。选项A是词性标注任务目标,C是情感分析任务目标,D是语言生成任务目标,均不符合Word2Vec的训练目标。

以下哪种模型属于生成式预训练模型?

A.BERT

B.GPT

C.RoBERTa

D.ALBERT

答案:B

解析:GPT(GenerativePre-trainedTransformer)是典型的生成式预训练模型,采用自回归(Autoregressive)训练方式,通过前向文本预测下一个词。BERT、RoBERTa、ALBERT均为判别式预训练模型,采用自编码(Autoencoding)训练方式(如掩码语言模型)。

中文分词中的“歧义切分”主要指?

A.分词工具无法处理生僻词

B.同一文本存在多种合理的切分方式

C.分词结果中出现标点符号

D.分词速度过慢影响实时性

答案:B

解析:歧义切分是中文分词的核心难点之一,指同一

文档评论(0)

1亿VIP精品文档

相关文档