- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于知识图谱的自动问答系统构建
摘 要 在当今社会,随着信息技术的飞速发展,人们对于信息准确化的需求越来越高,各种各样的信息获取方式层出不穷,传统的以关键词匹配以及文档检索为基础的搜索方法需要一场变革。现在很多研究者在信息检索中逐渐加入基于知识库的自动问答技术。同时,基于知识库的问答具有更简洁、更高效、更直接和更准确的特点,可以很好的提高获取信息的效率。目前关于中文知识库问答的研究还远远不足。由于中文表达的多样性以及中文句法结构的复杂性,中文知识库问答是一个非常有挑战性的工作。作者因为上述原因选择知识库问答的研究课题。 本文主要研究工作如下: 1)使用一种基于排序的实体链接方法。这种方法利用词汇特征和基于序列标注模型的语义特征。其中的基于序列标注模型的语义特征有效克服了知识库中实体构词特征稀疏以及无法利用知识库的实体词典等之前无法解决的问题。更适合中文问句主题实体链接。 2)使用一种基于匹配度计算的关系链推理方法。这种方法从两个方面去描述问句与候选关系链的匹配程度。在字粒度上,使用char-based F1 BLEU方法,在基于知识库的问答中,我们可以把问句泛化后得到的pattern看做参考译文,候选关系链看做预测译文。在词粒度上,先把问句以及对应的候选关系链用向量表示,然后计算问句和候选关系链的余弦相似度。 3)构建了一个基于知识图谱的中文开放领域知识库问答系统。 关键词:知识图谱;关系链推理;实体链接;问句分类;相似度计算;自然语言处理 作 者:马 进 第一章 绪 论 本章首先介绍基于知识图谱的自动问答系统的研究背景,然后简单介绍了什么是知识图谱以及基于知识图谱的问答系统的定义。在本章的最后简要地概括了整篇论文的组织结构。 1.1研究背景 自然语言处理(Natural Language Processing)是当前计算机科学领域中的一个非常重要的方向,自然语言指的是在人类漫长的发展史上所创造使用的语言,是人与人之间最基本的交流方式[1]。计算机与人之间通过自然语言进行交流是人工智能中非常重要的一部分。由于自然语言的多样性、抽象性和复杂性,从现有的基础理论和工程技术来看,自然语言处理是计算机科学和人工智能领域中很重要同时又很难解决的问题,有待于更多的理论研究创新和实践探索[2]。 自动问答(Automatic Question Answering)是自然语言处理领域中的一个重要分支,旨在让用户直接通过人类的自然语言问句从计算机中获得期望的答案[3]。近些年兴起的KBQA,可以直接将用户问题在知识库中所对应的实体检索出来,并作为答案返回给用户,是一种更为高效的问答方式[4]。 随着互联网的发展,人们使用搜索引擎来获取信息的需求也日期增加,但是基于传统的搜索引擎的方式,得到的结果是数万的链接,用户只需要其中一部分。用户就必须亲自仔细浏览这些网页去寻找自己真正想要的信息,是否存在没有被检索出来的相关网页也无从知晓。如何从浩如烟海的资料中为用户找到所需信息已成为信息时代的一个重要研究课题[5]。 1.2知识图谱 知识图谱(Knowledge Graph)是在自动问答系统中广为应用的一种知识库,它最初是由谷歌公司最初提出[6]。知识图谱是由大量的节点以及节点之间的有向边组成。其中节点表示知识库中的实体 (Entity) , 有向边表示实体与实体间的关系(Relation)。从存储结构来看,知识在这种知识库中以主语谓词宾语(SPO )三元组的形式表示[7]。谓词即表示关系的有向边,主语和宾语即与有向边相连的头节点和尾节点,因此也可以将知识图谱看作一种语义网络。 1.3基于知识图谱问答系统 近年来,随着大规模知识图谱的构建与完善,基于知识图谱的问答系统逐渐成为自动问答系统中的重要组成部分。基于知识图谱的自动问答的任务是将用户的自然问句转化成某种语义表示,并在知识图谱中进行查询,最终将知识图谱中与问题相关的实体作为答案返回给用户[8]。知识库问答中的核心问题在于如何将用户的非结构化输入与知识库中的结构化数据进行语义匹配,这涉及到自然语言处理中的多项技术[9]。当前很多搜索网站(如谷歌、百度)都可以对用户输入的问句型 query 提供知识库问答的结果,以便使信息获取的方式更为高效、简洁。 1.3本文组织结构 本文总共分成五个章节,具体章节结构如下: 第一章为绪论。介绍了本毕设系统的研究背景,并对知识图谱以及问题的定义作出简单介绍。 第二章介绍了自动问答。内容包括自动问答系统现状、自动问答系统概述、系统结构以及目前有关知识库问答的主流方法。 第三章详细介绍了KBQ
您可能关注的文档
- “冰上丝绸之路”黄金通道对俄贸易的影响.doc
- 【化学试验】镁铝双金属氢氧化物改性硬硅钙石对铅离子的吸附研究.doc
- 1KW负载光伏市电供电(互补)智能控制系统设计.doc
- 2019—2020学年广东省广州市增城区九年级物理期末考试模拟试题(有答案).doc
- 2020北京各区初三一模化学分类汇编—基本实验及其原理分析含答案.doc
- 2020北京各区初三一模化学分类汇编—科普阅读含答案.doc
- 2020年山东省临沂市平邑二中中考物理模拟试卷(5月份)(有答案).doc
- 2020年四川省成都市青羊区中考物理二诊试卷(有答案).doc
- ONLY的品牌营销策略分析.doc
- ppp模式在我国面临的问题及对策研究.doc
最近下载
- Unit 5 Travel Around China Lesson 15教学评大单元教学设计 2025北京版英语五年级上册.pdf
- 塔吊与施工电梯安全培训课件.pptx VIP
- 文献很重要designlife入门详解.pdf VIP
- 《托育机构保育指导大纲(试行)》解读.pptx VIP
- 工程师个人年终工作总结范文5篇.docx VIP
- 2025年英语PEP3年级上册-大单元整体教学设计正文 3上_Unit6.docx VIP
- 精益管理工具实用手册 .doc
- 任务3.3 农药的应用(课件)--高一《植物保护技术》同步教学(高等教育出版社).pptx VIP
- 英语四级高频词汇2000词(必背).docx
- 国开电大学习网《机械制图》形成性任务1-4答案.pdf VIP
原创力文档


文档评论(0)