- 1、本文档共78页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
摘要
近年来,随着互联网技术的迅猛发展,大量的专业领域知识通过各种方式涌入
到互联网中,用户如何从中获取有效信息也变得越来越具有挑战性。问答系统通过
语义信息分析用户问题,做出更简洁的回答,渐渐变成信息检索的新方式。
本文以医疗领域为例,分析构建领域问答系统的相关技术,并且深入研究知识
抽取和语义解析方面的技术,对模型和算法进行了改良,最终构建出基于知识图谱
的医疗问答系统。本文主要研究工作包括以下几个方面:
(1)提出了基于RoBERTa-wwm和全局指针的联合抽取模型RBLGP,目的是
把领域数据中的有效信息提炼成知识。模型采用了实体关系联合抽取的方式取代
传统管道式的抽取方式,减少了误差累积并提高了信息利用率;引入RoBERTa-
wwm预训练模型和BiLSTM来提取文本特征,提高了模型整体的语言理解能力;
采用全局指针完成三元组标记任务,有效避免了实体重叠和三元组重叠的影响。
(2)对智能问答方法中所使用的语义解析模型进行了改进,针对实体识别,提
出了基于RoBERTa-wwm-BiGRU-GlobalPointer模型RBGGP;针对文本分类,提出
了基于RoBERTa-wwm-TextRCNN-TextCNN模型RTT;同时,基于改进后的语义
解析模型,设计并实现了基于语义解析的智能问答方法。
(3)构建了基于知识图谱的领域问答系统。采用爬虫技术从互联网络信息网站
中抽取知识构建知识图谱,利用联合抽取模型获取领域文献中的知识来对图谱进
行补充,再通过文本相似度和语义相似度相结合的计算方法来进行知识融合,再通
过Neo4j数据库完成知识存储,构建出领域知识图谱;在知识图谱的支撑下,使用
改进的基于语义解析的智能问答方法构建领域问答服务;最后,采用前后端分离与
微服务相结合的架构,基于Vue和SpringBoot分别构建前后端,搭建出医疗领域
问答系统。
关键词:知识图谱,领域问答系统,知识抽取,语义解析
ABSTRACT
Inrecentyears,withtheInternettechnologyrapidlydeveloping,alotofprofessional
knowledgehasbeensavedintotheInternetinvariousforms.Howtoobtaineffective
informationfromithasbecomeincreasinglychallenging.Questionansweringsystemcan
resolveusersquestionsthroughsemanticinformationandmakemoreconciseanswers,
whichgraduallybecomesanewwayofinformationretrieval.
Inthisthesis,takingthemedicaldomainasresearchdirection,wediscussthe
relevantmethodofbuildingthedomainquestionansweringsystem.Andweconductin-
depthanalysisandresearchonthetechnologyofknowledgeextractionandsemantic
parsing,improvethedeeplearningmodel.Finally,webuildamedicalquestionanswering
systembasedonknowledgegraph.Themainresearchworkofthisthesisincludesthe
followingaspects:
(1)AjointextractionmodelRBLGPbasedonRoBERTA-wwmandmulti-layer
GlobalPointerisproposedtoe
文档评论(0)