- 0
- 0
- 约9.22千字
- 约 11页
- 2026-01-05 发布于上海
- 举报
自然语言处理工程师考试试卷
一、单项选择题(共10题,每题1分,共10分)
以下哪项是Word2Vec模型的核心训练目标?
A.预测句子的句法结构
B.根据中心词预测上下文词(CBOW)或根据上下文词预测中心词(Skip-gram)
C.生成符合语法的完整句子
D.学习文本的主题分布
答案:B
解析:Word2Vec包含CBOW(连续词袋模型)和Skip-gram两种架构,核心目标是通过局部上下文信息学习词的低维向量表示。CBOW用中心词周围的上下文词预测中心词,Skip-gram则相反。选项A是句法分析任务,C是语言模型目标,D是LDA(隐含狄利克雷分配)的目标,均错误。
以下哪项不属于BERT模型的预训练任务?
A.掩码语言模型(MLM)
B.下一句预测(NSP)
C.句子连贯性预测(SOP,后续改进任务)
D.机器翻译
答案:D
解析:BERT的原始预训练任务是MLM(随机掩码部分输入词并预测)和NSP(判断两句子是否连续)。后续改进模型如RoBERTa移除了NSP,采用SOP(句子顺序预测),但机器翻译属于生成任务,需在微调阶段结合特定数据训练,并非预训练任务。
长短期记忆网络(LSTM)通过以下哪种机制解决RNN的梯度消失问题?
A.门控单元(输入门、遗忘门、输出门)
B.多头注意力机制
C.残差连接
D.层归一化
答案:A
解析:LSTM引入三个门控单元(输入门控制新信息的加入,遗忘门控制旧记忆的保留,输出门控制记忆的输出),通过门控机制选择性地保留长期依赖信息,有效缓解梯度消失。B是Transformer的核心,C常见于ResNet,D用于稳定训练,均非LSTM的核心机制。
以下哪种分词方法属于基于统计学习的方法?
A.正向最大匹配法(FMM)
B.哈工大LTP分词
C.基于隐马尔可夫模型(HMM)的分词
D.基于规则的词典分词
答案:C
解析:HMM通过统计字与字之间的转移概率和发射概率进行分词,属于统计学习方法。FMM和基于规则的词典分词是基于字符串匹配的方法,哈工大LTP分词本质是结合统计模型(如CRF)的工具,因此C为正确选项。
在文本分类任务中,F1值的计算基于以下哪两个指标?
A.准确率(Accuracy)和召回率(Recall)
B.精确率(Precision)和召回率(Recall)
C.精确率(Precision)和准确率(Accuracy)
D.特异度(Specificity)和召回率(Recall)
答案:B
解析:F1值是精确率(预测为正的样本中实际为正的比例)和召回率(实际为正的样本中被正确预测的比例)的调和平均,公式为(F1=2)。其他选项的指标组合不符合定义。
以下哪项是Transformer模型中位置编码(PositionalEncoding)的作用?
A.替代循环结构,捕捉序列顺序信息
B.增强词向量的语义表示
C.减少模型参数量
D.提高模型的生成能力
答案:A
解析:Transformer使用自注意力机制替代循环结构,但自注意力本身不考虑序列顺序,因此通过位置编码(正弦/余弦函数或可学习参数)为词向量添加位置信息,以捕捉序列中的顺序关系。B是词嵌入的作用,C通过多头注意力实现,D依赖解码端的自回归机制,均错误。
以下哪种任务属于生成式自然语言处理任务?
A.情感分析(正/负分类)
B.命名实体识别(识别实体类型)
C.机器翻译(源语言→目标语言)
D.文本相似度计算(判断两段文本的相似程度)
答案:C
解析:生成式任务需要模型输出新的文本(如翻译、摘要、对话),而分析式任务(分类、NER、相似度)输出结构化标签或分数。因此C为生成式任务。
在预训练模型微调(Fine-tuning)过程中,通常需要:
A.冻结预训练模型的所有参数,仅训练新增的输出层
B.随机初始化预训练模型的参数,重新训练所有层
C.保持预训练模型的底层参数不变,微调顶层参数
D.对预训练模型的所有参数进行小学习率的更新
答案:D
解析:微调的核心是在预训练模型的基础上,用目标任务的小样本数据调整模型参数。通常采用较小的学习率(如1e-5)对所有参数进行更新(全参数微调),或冻结底层(提取通用特征)、微调顶层(适配任务)。A仅适用于特征提取(非微调),B是从头训练,C是部分微调的一种方式,但D更全面。
以下哪项是OOV(未登录词)问题的主要解决方案?
A.扩大训练语料的规模
B.使用子词(Subword)分词(如BPE)
C.增加词向量的维度
D.引入规则进行句法分析
答案:B
解析:OOV指训练语料中未出现的词,子词分词(如BPE、WordPiece)通过将词拆分为更小的子词单元(如字符或词缀),使模型能处理未登录词。A可
您可能关注的文档
- 自动驾驶的激光雷达成本下降路径(MEMS技术).docx
- 汉代“独尊儒术”对思想统一的作用.docx
- 《个人信息保护法》中“敏感个人信息”的范围界定.docx
- 《水浒传》中江湖文化的社会学解读.docx
- 499天价手机壳,杨紫Lisa同款,一年狂卖36亿.docx
- 2025年二级建造师考试题库(附答案和详细解析)(1231).docx
- 2025年数据资产管理员考试题库(附答案和详细解析)(1219).docx
- 2025年思科认证网络专家(CCIE)考试题库(附答案和详细解析)(1226).docx
- 2025年注册慈善财务规划师考试题库(附答案和详细解析)(1227).docx
- 2025年注册反洗钱师(CAMS)考试题库(附答案和详细解析)(1223).docx
原创力文档

文档评论(0)