2026年自然语言处理工程师考试题库(附答案和详细解析)(0226).docxVIP

  • 3
  • 0
  • 约9.25千字
  • 约 12页
  • 2026-04-18 发布于江苏
  • 举报

2026年自然语言处理工程师考试题库(附答案和详细解析)(0226).docx

自然语言处理工程师考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪项是Word2Vec模型的核心训练目标?

A.预测句子的下一个词

B.基于上下文预测中心词或基于中心词预测上下文

C.学习句子级别的语义表示

D.解决长距离依赖问题

答案:B

解析:Word2Vec包含两种训练模式:CBOW(连续词袋模型)通过上下文词预测中心词,Skip-gram通过中心词预测上下文词。选项A是语言模型(如GPT)的目标;选项C是句子嵌入(如Sentence-BERT)的目标;选项D是LSTM/Transformer的优势,故正确答案为B。

BERT模型的预训练任务不包括以下哪项?

A.掩码语言模型(MLM)

B.下一句预测(NSP)

C.填空任务(ClozeTask)

D.机器翻译(MT)

答案:D

解析:BERT的预训练任务是MLM(随机掩码部分输入词并预测)和NSP(判断两句话是否连续)。选项C是MLM的具体实现形式;选项D是下游任务而非预训练任务,故正确答案为D。

中文分词中,基于统计的方法(如HMM/CRF)与基于规则的方法最本质的区别是?

A.是否需要人工标注语料

B.是否利用上下文概率

C.是否依赖词典

D.是否处理歧义切分

答案:B

解析:统计方法(如HMM/CRF)通过训练语料学习词边界的概率分布,而规则方法依赖人工总结的切分规则(如“正向

文档评论(0)

1亿VIP精品文档

相关文档