- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
期末考试试题及答案B
适用班级: 专业:
考试时长:120分钟
一、选择题(单项选择其15题,每题2分,共30分)
1.自然语言处理的发展大致分为3个阶段:(),20世纪70年代和21世纪。
A.19世纪晚期
B.19世纪中期
C.19世纪早期
D.20世纪50年代
2.以下哪个不属于文件对象的方法?()
A.file.read([size])
B.file.write(str)
C.file.readline()
D.file.close()
3.为了保证无论是否出错都能正确地关闭文件,可以使用()来实现。
A.break
B.for循环语句
C.try---finally
D.if...else
4.目前的分词方法主要有三种:基于规则的分词方法、基于统计的
分词方法以及()。
A.基于语法的分词方法
B.基于语种的分词方法
C.基于语言的分词方法
D.基于语义的分词方法
5.采用jicba搜索引擎模式对南京市长江大桥”进行分词,得到的结果
为()
A.南京\市长江大桥
B.南京市/长江大桥
C.南京/南京市/京市/市长/长江/长江大桥/大桥
D.南京/京市/南京市/长江/大桥/长江大桥
6.词性标注的正确与否会直接影响到之后的()、语义分析,是中文
自然语言处理的基础之一.
A.词法分析
B.语言分析
C.句子分析
7.关于Stanfordparser下面说法不正确的是:()
A.Stanfordparser的底层是由Java实现的,因此需要确保安装JDK.
B.Stanfordparser的Python封装是在NLTK库中实现的,因此。需
要安装LTK库
D.句法分析
C.NLTK是一款Python的自然语言处理工具,但主要针对中文。
D.Stanfordparser基于概率统计进行句法分析。
8RNN的应用场景不包括()。
A.生成图像描述
B.语音识别
C.视频标记
D.自动拍照
9.当处理序列问题发现,当前时刻的输出既与前面时刻输入有关,又与未来时
刻输出有关。应选择哪个模型更为合适()
A.CNN
B.RNN
C.双向LSTM
D.GMM
10.关于cne-hut编码说法不正确的是()
A.one-hot编码是一位有效编码
B.每个状态都有自己独立的寄存器位
C.随着语料库词语的增加,词向量的维度高且稀疏
D.计算词与词之间的相似性
11.基于主题模型方法使用的算法是()。
ATF-IDF算法
B.LDA算法
C.TextRank算法
D.KNN算法
12.TF-IDF算法中使用哪个函数对数据集进行分词,去停用词()。
A.pos
B.corpus_path
C.preprocess
D.idf_die
13.根据代码确定fi_prior:为True的含义()。
classskleam.naive_bayes.MultinominalNB(aipha-1.0,
fit_pricr-True,class_prior-None)
A.不去学习类别先验概率
B.训练模型
C.追加训练模型
D.用模型进行预测
14.基于词典的情感分析方法的最大特点是().
A.简单
B.方便
C.复杂
D.快速
15.自然语言理解的简称是什么?()。10.6
A.NLP
B.ANN
C.NLU
D.APL
二、判断题(对的打‘√”,错的打‘X’,共10题,每题1分,共10分)
1.句法分析的主要任务是:识别出句子所包含的句法成分,以及这些成分之间的关系。()
2.jieba分词工具提供了词性标注功能。jicba分词是结合规则和统计的方式,也就是说同时使用词典匹配和HMM。()
3.Stanfordparser的底层是由python实现的。()
4.re.match尝试从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,就返回none。
5.re.match尝试从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,就返回none。()
6.自然语言处理(NaturalLanguageProcessing,NLP)是计算机科学领域以及大数据领域的一个重要的研究方向。()
7.基于语义的分词方法通常包括三个部分分词子系统、句法语义子系统、总控部分。()
8.条件随机场(CRF)也是一种基于马尔科夫思想的统计模型。之前的模型都假设每个状态均只与它前面的状态有关。()
9.命名实体识别(NER)的目的在于识别语料中人名、地名、组织机构名等命名实体。()
10.LTP的主要模型中SentenceSplitter是分句模型。()
三、填空题(共13题,每空1分,共20分)
1.自然语言处理的发展历程分别是:19世纪早期 、 。
2.目前的分词方法主要有三种:基于
您可能关注的文档
- 语音识别技术及应用项目四.pptx
- 《自然语言处理技术及应用》期末考试试题及答案A.docx
- 项目2 构建语料库.docx
- 《自然语言处理技术及应用》答案.pdf
- 《计算机视觉技术及应用》答案.pdf
- 计算机视觉技术及应用试卷A.doc
- 计算机视觉技术及应用试卷B.doc
- 广东省东莞市2024-2025学年八年级上学期期中考试物理试题(解析版).pdf
- 广东省东莞市2024-2025学年八年级上学期期中地理试卷(解析版).pdf
- 豆腐乳发酵设备运维技师(中级)考试试卷及答案.doc
- 广东省东莞市2024-2025学年八年级上学期生物期中试题(解析版).pdf
- 非遗剪纸文创产品开发经理岗位招聘考试试卷及答案.doc
- 广东省东莞市2024-2025学年高二上学期期末教学质量检查数学试题.pdf
- 体育安全理论课件图片素材.ppt
- 3.1 公民基本权利 课件-2025-2026学年道德与法治八年级下册 统编版 .pptx
- 广东省潮州市湘桥区城南实验中学等校2024-2025学年八年级上学期期中地理试题(解析版).pdf
- 大数据运维工程师岗位招聘考试试卷及答案.doc
- 广东省深圳市福田区八校2026届数学八年级第一学期期末教学质量检测模拟试题含解析.doc
- 广东省潮州市湘桥区城基初级中学2024-2025学年八年级上学期11月期中考试数学试题(解析版).pdf
- 广东省潮州市湘桥区城西中学2024-2025学年八年级上学期期中地理试题(解析版).pdf
最近下载
- 教育强国建设背景下研究型、应用型、技能型高校建设的责任与使命.docx VIP
- 泥浆护壁旋挖钻孔灌注桩施工技术交底.docx VIP
- T-CSUS《城镇排水管网运行和维护智能化技术标准》.pdf VIP
- 2024-2025学年上海市黄浦区五年级(上)语文期末试卷及答案.docx VIP
- 广东省东莞市八大民办学校联考2024-2025学年九年级上学期期末语文试题【含答案】.pdf
- 危重孕产妇和新生儿救治中心PPT.pptx VIP
- 2025年Z世代汽车消费趋势与购车决策分析报告.docx
- 异常工况处置能力培训试题.docx VIP
- 2025年湖南省书记员招聘笔试真题及答案.docx VIP
- _实验室pH计比对结果分析及测量不确定度评定.pdf VIP
原创力文档


文档评论(0)