2026年自然语言处理工程师考试题库(附答案和详细解析)(0308).docxVIP

  • 1
  • 0
  • 约8.13千字
  • 约 11页
  • 2026-04-25 发布于江苏
  • 举报

2026年自然语言处理工程师考试题库(附答案和详细解析)(0308).docx

自然语言处理工程师考试试卷(总分100分)

一、单项选择题(共10题,每题1分,共10分)

Word2Vec的Skip-gram模型的训练目标是?

A.预测中心词周围的上下文词

B.预测上下文词对应的中心词

C.最大化词向量的余弦相似度

D.最小化句子的困惑度

答案:A

解析:Skip-gram模型的核心是“用中心词预测其周围的上下文词”(如给定“苹果”,预测“吃”“水果”等),而CBOW模型是“用上下文词预测中心词”(选项B错误)。选项C是词向量的评估指标,选项D是语言模型的训练目标(如GPT),均非Skip-gram的目标。

BERT预训练任务中“掩码语言模型(MLM)”的掩码策略是?

A.固定替换15%的词为[MASK]

B.15%的词中,80%替换为[MASK],10%替换为随机词,10%保持原词

C.20%的词替换为[MASK],其余保持原词

D.仅替换动词为[MASK]

答案:B

解析:BERT的MLM任务中,为避免模型仅学习[MASK]位置的模式,采用动态掩码策略:随机选择15%的词,其中80%替换为[MASK],10%替换为随机词,10%保持原词(选项B正确)。选项A未考虑随机词和原词的保留,选项C比例错误,选项D限定词性不符合原设计。

以下哪个模型属于生成式预训练模型?

A.BERT

B.GPT

C.RoBERTa

D.ALBERT

答案:

文档评论(0)

1亿VIP精品文档

相关文档