《自然语言处理技术及应用》期末考试试题及答案B.docxVIP

下载本文档

0
0
约4.39千字
约 7页
2026-01-09 发布于湖南
举报
版权申诉

《自然语言处理技术及应用》期末考试试题及答案B.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

期末考试试题及答案B

适用班级：专业：

考试时长：120分钟

一、选择题（单项选择其15题，每题2分，共30分）

1．自然语言处理的发展大致分为3个阶段：（），20世纪70年代和21世纪。

A．19世纪晚期

B．19世纪中期

C．19世纪早期

D．20世纪50年代

2．以下哪个不属于文件对象的方法?（）

A．file．read（[size]）

B．file．write（str）

C．file．readline（）

D．file．close（）

3．为了保证无论是否出错都能正确地关闭文件，可以使用（）来实现。

A．break

B．for循环语句

C．try---finally

D．if．．．else

4．目前的分词方法主要有三种：基于规则的分词方法、基于统计的

分词方法以及（）。

A．基于语法的分词方法

B．基于语种的分词方法

C．基于语言的分词方法

D．基于语义的分词方法

5．采用jicba搜索引擎模式对南京市长江大桥”进行分词，得到的结果

为（）

A．南京\市长江大桥

B．南京市/长江大桥

C．南京/南京市/京市/市长/长江/长江大桥/大桥

D．南京/京市/南京市/长江/大桥/长江大桥

6．词性标注的正确与否会直接影响到之后的（）、语义分析，是中文

自然语言处理的基础之一．

A．词法分析

B．语言分析

C．句子分析

7．关于Stanfordparser下面说法不正确的是：（）

A．Stanfordparser的底层是由Java实现的，因此需要确保安装JDK．

B．Stanfordparser的Python封装是在NLTK库中实现的，因此。需

要安装LTK库

D．句法分析

C．NLTK是一款Python的自然语言处理工具，但主要针对中文。

D．Stanfordparser基于概率统计进行句法分析。

8RNN的应用场景不包括（）。

A．生成图像描述

B．语音识别

C．视频标记

D．自动拍照

9．当处理序列问题发现，当前时刻的输出既与前面时刻输入有关，又与未来时

刻输出有关。应选择哪个模型更为合适（）

A．CNN

B．RNN

C．双向LSTM

D．GMM

10．关于cne-hut编码说法不正确的是（）

A．one-hot编码是一位有效编码

B．每个状态都有自己独立的寄存器位

C．随着语料库词语的增加，词向量的维度高且稀疏

D．计算词与词之间的相似性

11．基于主题模型方法使用的算法是（）。

ATF-IDF算法

B．LDA算法

C．TextRank算法

D．KNN算法

12．TF-IDF算法中使用哪个函数对数据集进行分词，去停用词（）。

A．pos

B．corpus_path

C．preprocess

D．idf_die

13．根据代码确定fi_prior：为True的含义（）。

classskleam．naive_bayes．MultinominalNB（aipha-1．0,

fit_pricr-True,class_prior-None）

A．不去学习类别先验概率

B．训练模型

C．追加训练模型

D．用模型进行预测

14．基于词典的情感分析方法的最大特点是（）．

A．简单

B．方便

C．复杂

D．快速

15．自然语言理解的简称是什么?（）。10．6

A．NLP

B．ANN

C．NLU

D．APL

二、判断题（对的打‘√”，错的打‘X’，共10题，每题1分，共10分）

1．句法分析的主要任务是：识别出句子所包含的句法成分，以及这些成分之间的关系。（）

2．jieba分词工具提供了词性标注功能。jicba分词是结合规则和统计的方式，也就是说同时使用词典匹配和HMM。（）

3．Stanfordparser的底层是由python实现的。（）

4．re.match尝试从字符串的起始位置匹配一个模式，如果起始位置匹配不成功的话，就返回none。

5．re.match尝试从字符串的起始位置匹配一个模式，如果起始位置匹配不成功的话，就返回none。（）

6．自然语言处理（NaturalLanguageProcessing，NLP）是计算机科学领域以及大数据领域的一个重要的研究方向。（）

7．基于语义的分词方法通常包括三个部分分词子系统、句法语义子系统、总控部分。（）

8．条件随机场（CRF）也是一种基于马尔科夫思想的统计模型。之前的模型都假设每个状态均只与它前面的状态有关。（）

9．命名实体识别（NER）的目的在于识别语料中人名、地名、组织机构名等命名实体。（）

10．LTP的主要模型中SentenceSplitter是分句模型。（）

三、填空题（共13题，每空1分，共20分）

1．自然语言处理的发展历程分别是：19世纪早期、。

2．目前的分词方法主要有三种：基于

您可能关注的文档

文档评论（0）

长情又很酷 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

《自然语言处理技术及应用》期末考试试题及答案B.docxVIP