- 8
- 0
- 约9.44千字
- 约 12页
- 2026-04-28 发布于江苏
- 举报
自然语言处理工程师考试试卷
一、单项选择题(共10题,每题1分,共10分)
以下哪项是Word2Vec模型的核心训练目标?
A.预测当前词的词类标注
B.最大化上下文词与目标词的共现概率
C.分类文本的情感倾向
D.生成符合语法的句子
答案:B
解析:Word2Vec的核心是通过滑动窗口获取上下文词与中心词的共现关系,训练目标是最大化上下文词与目标词的联合概率(Skip-gram模型)或目标词对上下文的预测概率(CBOW模型)。选项A是词性标注任务目标,C是情感分析任务目标,D是语言生成任务目标,均不符合Word2Vec的训练目标。
以下哪种模型属于生成式预训练模型?
A.BERT
B.GPT
C.RoBERTa
D.ALBERT
答案:B
解析:GPT(GenerativePre-trainedTransformer)是典型的生成式预训练模型,采用自回归(Autoregressive)训练方式,通过前向文本预测下一个词。BERT、RoBERTa、ALBERT均为判别式预训练模型,采用自编码(Autoencoding)训练方式(如掩码语言模型)。
中文分词中的“歧义切分”主要指?
A.分词工具无法处理生僻词
B.同一文本存在多种合理的切分方式
C.分词结果中出现标点符号
D.分词速度过慢影响实时性
答案:B
解析:歧义切分是中文分词的核心难点之一,指同一
原创力文档

文档评论(0)