- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
自然语言处理工程师考试试卷
一、单项选择题(共10题,每题1分,共10分)
自然语言处理(NLP)的核心目标是?
A.处理所有类型的语言数据(文本、语音、图像)
B.让计算机理解和生成人类语言
C.替代人工完成所有语言相关工作
D.实现高精度的语音识别
答案:B
解析:NLP的核心是通过算法使计算机能够理解、处理和生成自然语言(如文本或语音),而非单纯处理数据(A错误)或替代人工(C错误)。语音识别是NLP的子任务之一(D错误)。
以下属于中文分词工具的是?
A.SpaCy
B.jieba
C.CoreNLP
D.OpenNMT
答案:B
解析:jieba是经典的中文分词工具;SpaCy(A)和CoreNLP(C)主要用于英文处理;OpenNMT(D)是机器翻译框架(错误)。
Word2Vec的训练目标是?
A.捕捉全局词频统计信息
B.预测上下文或中心词
C.学习双向上下文表征
D.生成连贯的文本序列
答案:B
解析:Word2Vec通过“中心词预测上下文”(Skip-gram)或“上下文预测中心词”(CBOW)训练词向量;全局统计是GloVe的特点(A错误);双向上下文是BERT的特性(C错误);生成文本是GPT等自回归模型的目标(D错误)。
命名实体识别(NER)的主要任务是?
A.判断文本情感倾向
B.提取文本中的特定类别实体(如人名、地名)
C.将长文本压缩为短摘要
D.分析句子的语法结构
答案:B
解析:NER的核心是识别并分类文本中的实体(如“北京”→地名);情感分析是A的任务(错误);文本摘要为C(错误);句法分析为D(错误)。
以下哪项是BERT模型的输入特征?
A.仅词嵌入(TokenEmbedding)
B.词嵌入+位置嵌入(PositionEmbedding)
C.词嵌入+段嵌入(SegmentEmbedding)+位置嵌入
D.仅位置嵌入
答案:C
解析:BERT输入包含三部分嵌入:词嵌入(Token)、段嵌入(区分句子对)、位置嵌入(编码词序);A、D遗漏关键部分(错误);B缺少段嵌入(错误)。
机器翻译中常用的评估指标是?
A.BLEU
B.F1-score
C.AUC-ROC
D.Perplexity
答案:A
解析:BLEU(双语评估替换)是机器翻译的经典评估指标;F1用于分类任务(B错误);AUC用于二分类(C错误);Perplexity是语言模型的评估指标(D错误)。
以下哪种模型属于生成式预训练模型?
A.BERT
B.GPT
C.ELMo
D.RoBERTa
答案:B
解析:GPT是自回归(生成式)预训练模型,通过预测下一个词训练;BERT(A)、ELMo(C)、RoBERTa(D)均为自编码模型(错误)。
中文分词中的“未登录词”指?
A.已被词典收录的常见词
B.词典中未收录的新词汇(如网络新词)
C.句子中的停用词
D.多义词
答案:B
解析:未登录词(OOV)指训练词典中未包含的词(如“元宇宙”);A是已登录词(错误);C是停用词(错误);D是多义词(错误)。
情感分析的本质是?
A.文本分类任务(如积极/消极)
B.序列标注任务
C.机器翻译任务
D.问答系统任务
答案:A
解析:情感分析通常将文本分类为积极、消极或中性等类别;序列标注是NER等任务(B错误);C、D为其他任务类型(错误)。
以下哪项是Transformer模型的核心创新?
A.循环神经网络(RNN)结构
B.长短时记忆(LSTM)单元
C.自注意力机制(Self-Attention)
D.卷积核(ConvolutionKernel)
答案:C
解析:Transformer通过自注意力机制解决了RNN的长距离依赖问题;RNN(A)、LSTM(B)是传统序列模型(错误);卷积核是CNN的核心(D错误)。
二、多项选择题(共10题,每题2分,共20分)(每题至少2个正确选项)
以下属于预训练语言模型的有?
A.BERT
B.GPT
C.Word2Vec
D.GloVe
答案:AB
解析:BERT和GPT是基于深度神经网络的预训练模型;Word2Vec(C)和GloVe(D)是静态词向量模型(非深层预训练)。
文本分类的常用模型包括?
A.卷积神经网络(CNN)
B.循环神经网络(RNN)
C.Transformer
D.条件随机场(CRF)
答案:ABC
解析:CNN、RNN、Transformer均用于文本分类;CRF是序列标注任务的模型(D错误)。
以下哪些是自然语言生成(NLG)的应用场景?
A.智能客服回复
B.新闻自动生成
C.情感分析
D.机器翻译
答案:ABD
解析:NLG关注文本生成(如
您可能关注的文档
- 2025年强化学习工程师考试题库(附答案和详细解析)(1227).docx
- 2025年注册电气工程师考试题库(附答案和详细解析)(1231).docx
- 2025年自然语言处理工程师考试题库(附答案和详细解析)(1211).docx
- 2026年大数据工程师职业资格考试题库(附答案和详细解析)(0101).docx
- 2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0101).docx
- 2026年运动营养师考试题库(附答案和详细解析)(0101).docx
- 5的来源解析(工业vs机动车).docx
- REITs的现金流拆分与估值逻辑.docx
- 《傲慢与偏见》中伊丽莎白的婚姻观演变.docx
- 一体铸造是画饼还是大趋势?大家吵得不可开交.docx
- 实验室危废随意倾倒查处规范.ppt
- 实验室危废废液处理设施规范.ppt
- 实验室危废处置应急管理规范.ppt
- 初中地理中考总复习精品教学课件课堂讲本 基础梳理篇 主题10 中国的地理差异 第20课时 中国的地理差异.ppt
- 初中地理中考总复习精品教学课件课堂讲本 基础梳理篇 主题10 中国的地理差异 第21课时 北方地区.ppt
- 危险废物处置人员防护培训办法.ppt
- 危险废物处置隐患排查技术指南.ppt
- 2026部编版小学数学二年级下册期末综合学业能力测试试卷(3套含答案解析).docx
- 危险废物处置违法案例分析汇编.ppt
- 2026部编版小学数学一年级下册期末综合学业能力测试试卷3套精选(含答案解析).docx
原创力文档


文档评论(0)