《自然语言处理技术及应用》答案.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

《自然语言处理技术及应用》

项目考核参考答案

项目1搭建自然语言处理开发环境

1.选择题

(1)D

(2)A

(3)C

(4)A

(5)B

2.填空题

(1)句法分析

(2)平均排序倒数;平均精度均值

(3)词性标注;去停用词

3.简答题

(1)自然语言处理(naturallanguageprocessing,NLP)是一项致力于研究如何使用计

算机处理、理解及运用人类语言,实现人机之间有效通信的技术。自然语言处理是计算机

科学领域和人工智能领域的一个重要研究方向,是一门融语言学、计算机科学、数学和统

计学于一体的学科。

(2)自然语言处理的应用领域主要有机器翻译、智能问答、文本摘要、文本分类、

信息检索与情感分析。(写出其中5个就算正确)

(3)机器学习、深度学习与自然语言处理之间的关系如图1-1所示。

人工智能

(AI)

机器学习

(ML)

自然语言处理

(NLP)

深度学习

(DL)

图1-1机器学习、深度学习与自然语言处理之间的关系

项目2构建语料库

1.选择题

(1)A

(2)A

(3)D

(4)B

(5)B

2.填空题

(1)NLTK;网络

(2)gutenberg

(3)结束

(4)+

3.简答题

(1)语料库的实质是经过科学取样和加工的大规模电子文本库,是为某一个或多个

应用目标而专门收集的,有一定结构和代表性且可被计算机程序检索的,具有一定规模的,

标注了语法、语义、语音和语用等语言信息的语料(语料指语言材料)集合。

(2)正则表达式是一个可用于模式匹配和替换的工具,由普通字符和元字符(特殊

字符)组成,其设计思想是用一种描述性语言给字符串定义一个规则,然后按这一规则进

行字符串匹配。凡是符合规则的字符串就认为匹配成功,否则就认为匹配失败。

项目3词法分析

1.选择题

(1)B

(2)B

(3)A

(4)D

(5)C

2.填空题

(1)正向最大匹配法;双向最大匹配法

(2)最大概率路径

(3)实体类;时间类

(4)N元模型

3.简答题

(1)jieba提供了精确模式、全模式和搜索引擎等分词模式。

①精确模式:采用最精准的方式将语句进行切分,适用于文本分析。精确模式为默

认的分词模式。

②全模式:将句子中所有可以成词的词语都扫描出来,速度非常快,但不能解决歧义问题。

③搜索引擎模式:在精确模式的基础上,对长词再次进行切分,适用于搜索引擎分

词。

(2)双向最大匹配法的基本思想是将正向最大匹配法和逆向最大匹配法得到的分词

结果进行比较,从中选择合适的分词方法。双向最大匹配法的规则如下。

①若两种方法的分词结果的词语数量不相等,则选取分词数量较少的一组作为最终

结果。

②若两种方法的分词结果的词语数量相等,则有两种情况。当分词结果完全一致时,

则说明没有歧义,可随机选择一组作为最终结果;当分词结果不一致时,则选择单字数量

较少的一组作为最终结果。

项目4关键词提取

1.选择题

(1)B

(2)A

(3)C

(4)A

(5)A

2.填空题

(1)二分类

文档评论(0)

长情又很酷 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档