面向多领域大规模知识库的自然语言自动问答研究-计算机应用技术专业毕业论文.docxVIP

下载本文档

6
0
约5.91万字
约 67页
2019-05-08 发布于上海
举报
版权申诉

面向多领域大规模知识库的自然语言自动问答研究-计算机应用技术专业毕业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

国内图书分类号：TP391．1 国内图书分类号：TP391．1 密级：公开国际图书分类号：004 西南交通大学研究生学位论文年级 2Q 1 2级姓名塞筮申请学位级别亟± 专业让篡扭应届撞苤：：指导老师翌红迅』杨基塾援二零一五年四月一奄一直，年四月万方数据 Classified Classified Index：TP39 1．1 U．D．C：004 Southwest Jiaotong University Master Degree Thesis Research on natural language question answering for large—-scale multi--domains knowledge base Grade：2012 Candidate：Zhu Min Academic Degree Applied for：Master Degree Speciality：Computer Application Technology Supervisor：Prof．Yin HongFeng／Yang Yan April 24，2015 万方数据西南交通大学西南交通大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定，同意学校保留并向国家有关部门或机构送交论文的复印件和电子版，允许论文被查阅和借阅。本人授权西南交通大学可以将本论文的全部或部分内容编入有关数据库进行检索，可以采用影印、缩印或扫描等复印手段保存和汇编本学位论文。本学位论文属于 1．保密口，在年解密后适用本授权书； 2．不保密d使用本授权书。 (请在以上方框内打“-4”) 学位论文作者签名：缀指导老师签名：日期： 2015．多·}多日期：矽区5．莎万方数据西南交通大学硕士学位论文主要工作(贡献)声明本人在学位论文中所做的主要工作或贡献如下：西南交通大学硕士学位论文主要工作(贡献)声明本人在学位论文中所做的主要工作或贡献如下： (1)对知识存储模型做了深入全面的分析研究，针对传统知识存储模型不具备很好的知识推理能力的问题，构建了RDF知识库，用三元组的模式来存储知识； (2)部分类别的命名实体词难以识别，因此需要进行命名实体识别。针对命名实体识别的问题，研究了两种机器学习方法，以及特征模板的选取问题，同时研究了不同的机器学习方法以及不同的特征模板选取对命名实体识别准确率的影响，最终达到高准确率的识别； (3)针对自然语言问句语义难理解的问题，提出了一种基于问句语义图的问旬理解方法，实验表明该方法能有效解决自然语言问句语义理解的问题； (4)针对RDF知识库需要用SPARQL语言进行查询的问题，构建了自动生成 SPARQL查询实例的查询体系。本人郑重声明：所呈交的学位论文，是在导师指导下独立进行研究工作所得的成果。除文中已经注明引用的内容外，本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体，均已在文中作了明确说明。本人完全了解违反上述声明所引起的一切法律责任将由本人承担。学位论文作者签名：倦数日期：和l写5．I罗万方数据西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文第1页摘要随着计算机和网络的飞速发展，我们已经进入了数据信息爆炸式增长的时代，如何从海量的非结构化信息中提取真正满足用户需求的信息，已经成为一个越来越重要的研究课题。自然语言问答系统应运而生，它是一个能够对计算机用户或移动用户以自然语言形式描述的问句做出高效、准确回答的问答系统。本文研究的课题是面向多领域大规模知识库的自然语言自动问答研究。本文主要研究人物、地理、机构、音乐和电影这五类的自然语言自动问答。除构建知识库外，其精髓是如何进行准确高效的自然语言问句语义理解。与传统的搜索引擎不同，自然语言自动问答系统不是简单的关键词组合匹配，而是需要理解用户意图，因此，自然语言自动问答系统面临着很多困难，主要有两点：一是需要构建大规模知识库以及能够高效查询的查询体系；二是系统的输入是日常使用的自然语言，需要对自然语言问旬进行理解分析，得到用户意图。针对上述问题，本文提出了一系列解决方法，主要有以下四点：一是构建知识库。对知识存储模型做了深入研究，根据存储模型需要满足能够大规模存储数据且高效查询、又能支持知识推理的特点，决定使用RDF存储模型存储知识。本文按类别爬取了百科数据和豆瓣数据，构建RDF知识库；二是进行命名实体识别。自然语言问句理解首先需要识别命名实体，本文使用机器学习的方法进行命名实体识别，研究了两种机器学习方法：SVM统计模型和CRF 统计模型，以及两种统计模