《自然语言处理技术及应用》期末考试试题及答案B.docxVIP

《自然语言处理技术及应用》期末考试试题及答案B.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

期末考试试题及答案B

适用班级: 专业:

考试时长:120分钟

一、选择题(单项选择其15题,每题2分,共30分)

1.自然语言处理的发展大致分为3个阶段:(),20世纪70年代和21世纪。

A.19世纪晚期

B.19世纪中期

C.19世纪早期

D.20世纪50年代

2.以下哪个不属于文件对象的方法?()

A.file.read([size])

B.file.write(str)

C.file.readline()

D.file.close()

3.为了保证无论是否出错都能正确地关闭文件,可以使用()来实现。

A.break

B.for循环语句

C.try---finally

D.if...else

4.目前的分词方法主要有三种:基于规则的分词方法、基于统计的

分词方法以及()。

A.基于语法的分词方法

B.基于语种的分词方法

C.基于语言的分词方法

D.基于语义的分词方法

5.采用jicba搜索引擎模式对南京市长江大桥”进行分词,得到的结果

为()

A.南京\市长江大桥

B.南京市/长江大桥

C.南京/南京市/京市/市长/长江/长江大桥/大桥

D.南京/京市/南京市/长江/大桥/长江大桥

6.词性标注的正确与否会直接影响到之后的()、语义分析,是中文

自然语言处理的基础之一.

A.词法分析

B.语言分析

C.句子分析

7.关于Stanfordparser下面说法不正确的是:()

A.Stanfordparser的底层是由Java实现的,因此需要确保安装JDK.

B.Stanfordparser的Python封装是在NLTK库中实现的,因此。需

要安装LTK库

D.句法分析

C.NLTK是一款Python的自然语言处理工具,但主要针对中文。

D.Stanfordparser基于概率统计进行句法分析。

8RNN的应用场景不包括()。

A.生成图像描述

B.语音识别

C.视频标记

D.自动拍照

9.当处理序列问题发现,当前时刻的输出既与前面时刻输入有关,又与未来时

刻输出有关。应选择哪个模型更为合适()

A.CNN

B.RNN

C.双向LSTM

D.GMM

10.关于cne-hut编码说法不正确的是()

A.one-hot编码是一位有效编码

B.每个状态都有自己独立的寄存器位

C.随着语料库词语的增加,词向量的维度高且稀疏

D.计算词与词之间的相似性

11.基于主题模型方法使用的算法是()。

ATF-IDF算法

B.LDA算法

C.TextRank算法

D.KNN算法

12.TF-IDF算法中使用哪个函数对数据集进行分词,去停用词()。

A.pos

B.corpus_path

C.preprocess

D.idf_die

13.根据代码确定fi_prior:为True的含义()。

classskleam.naive_bayes.MultinominalNB(aipha-1.0,

fit_pricr-True,class_prior-None)

A.不去学习类别先验概率

B.训练模型

C.追加训练模型

D.用模型进行预测

14.基于词典的情感分析方法的最大特点是().

A.简单

B.方便

C.复杂

D.快速

15.自然语言理解的简称是什么?()。10.6

A.NLP

B.ANN

C.NLU

D.APL

二、判断题(对的打‘√”,错的打‘X’,共10题,每题1分,共10分)

1.句法分析的主要任务是:识别出句子所包含的句法成分,以及这些成分之间的关系。()

2.jieba分词工具提供了词性标注功能。jicba分词是结合规则和统计的方式,也就是说同时使用词典匹配和HMM。()

3.Stanfordparser的底层是由python实现的。()

4.re.match尝试从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,就返回none。

5.re.match尝试从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,就返回none。()

6.自然语言处理(NaturalLanguageProcessing,NLP)是计算机科学领域以及大数据领域的一个重要的研究方向。()

7.基于语义的分词方法通常包括三个部分分词子系统、句法语义子系统、总控部分。()

8.条件随机场(CRF)也是一种基于马尔科夫思想的统计模型。之前的模型都假设每个状态均只与它前面的状态有关。()

9.命名实体识别(NER)的目的在于识别语料中人名、地名、组织机构名等命名实体。()

10.LTP的主要模型中SentenceSplitter是分句模型。()

三、填空题(共13题,每空1分,共20分)

1.自然语言处理的发展历程分别是:19世纪早期 、 。

2.目前的分词方法主要有三种:基于

您可能关注的文档

文档评论(0)

长情又很酷 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档