2026年自然语言处理工程师考试题库（附答案和详细解析）（0308）.docxVIP

2026年自然语言处理工程师考试题库（附答案和详细解析）（0308）.docx

自然语言处理工程师考试试卷（总分100分）

一、单项选择题（共10题，每题1分，共10分）

Word2Vec的Skip-gram模型的训练目标是？

A.预测中心词周围的上下文词

B.预测上下文词对应的中心词

C.最大化词向量的余弦相似度

D.最小化句子的困惑度

答案：A

解析：Skip-gram模型的核心是“用中心词预测其周围的上下文词”（如给定“苹果”，预测“吃”“水果”等），而CBOW模型是“用上下文词预测中心词”（选项B错误）。选项C是词向量的评估指标，选项D是语言模型的训练目标（如GPT），均非Skip-gram的目标。

BERT预训练任务中“掩码语言模型（MLM）”的掩码策略是？

A.固定替换15%的词为[MASK]

B.15%的词中，80%替换为[MASK]，10%替换为随机词，10%保持原词

C.20%的词替换为[MASK]，其余保持原词

D.仅替换动词为[MASK]

答案：B

解析：BERT的MLM任务中，为避免模型仅学习[MASK]位置的模式，采用动态掩码策略：随机选择15%的词，其中80%替换为[MASK]，10%替换为随机词，10%保持原词（选项B正确）。选项A未考虑随机词和原词的保留，选项C比例错误，选项D限定词性不符合原设计。

以下哪个模型属于生成式预训练模型？

A.BERT

B.GPT

C.RoBERTa

D.ALBERT

答案：

更多 >