面向科技文献的学术知识图谱构建研究与应用.pdfVIP

面向科技文献的学术知识图谱构建研究与应用.pdf

  1. 1、本文档共69页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要

面向科技文献的学术知识图谱构建研究与应用

随着互联网大数据时代的到来,如何从海量科技文献中快速检索论文,准确

提取领域知识并帮助学者发现新的研究任务和方法,成为学术社区的很大挑战。

学术知识图谱将学术社区的异质信息整合成结构化知识网络,将真实语义上具有

密切联系的科学实体关联起来,能够帮助检索论文。一篇文献通常会针对特定的

领域任务提出相应的解决方法,但是,目前的学术知识图谱重点关注文献的作者、

领域和关键词等结构信息,很少挖掘蕴含在文献摘要中的任务和方法等语义信息。

如果围绕任务和方法构建涵盖学术概念、科技文献、作者和机构等信息的知识网

络,那么基于网络结构进行语义推理可以帮助学者定位领域研究内容,探索科研

动向以及发现学术社交网络等。因此,本文的目标是面向科技文献构建一个以领

域任务和研究方法为中心,容纳学者、机构和关键词等信息的学术知识图谱。

本文工作是吉林省重点科技研发项目“大数据和移动互联时代的快速知识共

享系统研究、开发与应用”的重要研究内容,该项目旨在开发一款用于学术知识

快速共享的学习类移动端软件。用户可通过该软件阅读国内外期刊会议、科技文

献和作者简介等学术信息,动态追踪科技快讯和研究热点,以及添加好友和群组、

在线交流和评论等社交行为。基于此项目背景,本文的主要工作如下:

(1)提出一种基于维基数据的学术本体半自动构建算法。该算法将维基百

科作为高质量外部数据源,从百科文本中自动提取领域概念作为本体库节点,并

定义节点间的上下位关系。在领域专家指导下进行半自动本体检查,对初始构建

的学术本体库进行剪枝、清洗和补全,从而构建可用于链接学术知识图谱实体层

的高质量本体库。

(2)提出一种基于双轮问答的学术实体-关系联合抽取算法DoubleQA-IE。

该算法将问答领域的片段抽取任务迁移至知识图谱构建任务,从文献摘要中抽取

学术实体和关系并将链接实体至相应本体概念。给定问题、摘要和候选本体,将

候选本体作为锚节点与文本序列联合嵌入,利用嵌入矩阵的相容性计算单词序列

的注意力权重,设计双向深层注意力网络结构编码文本的语义表征。第一轮问答

同时预测学术实体在摘要中的起止位置、类别标签和链接的本体标签;第二轮问

答根据第一轮预测的头实体进行答案填充,对关系类型、尾实体和本体标签进行

联合预测。

(3)将算法落地到实际应用中,面向上述项目整合的计算机学科人工智能

领域科技文献,基于上述算法构建了一个实际可用的学术领域知识图谱。该学术

图谱是以任务和方法为中心的具有三层结构的知识网络:实体层是知识图谱的核

心层,以DoubleQA-IE算法抽取的任务和方法为中心节点,节点间包括使用、

对比和部分三种关系;学术本体库是知识图谱的基础层,以本体构建算法抽取的

科学概念为中心,用于链接实体层节点,使其具有上下位关系并进行语义消解;

文本层是学术图谱的扩展层,以项目整合的科技文献为中心,容纳了标题、关键

词和出版时间等属性信息以及期刊会议、科研作者和软件用户等异质节点,用于

实体层任务和方法节点的文本定位。本文构建的学术知识图谱已应用于该项目支

撑的软件《学术头条APP》中。

关键词:

学术知识图谱,问答,实体-关系抽取,本体构建

Abstract

ResearchandApplicationofAcademicKnowledgeGraph

ConstructionforTechnologicalLiterature

WiththearrivalofInternetbigdataera,howtoquicklyretrievepapersfrom

massivetechnologicalliterature,accuratelyextractdomainknowledgeandhelp

scholarsdiscovernewtasksandmethodshasbecomeamajorchallengeforacademic

community.Academicknowledgegraphintegratesthe

您可能关注的文档

文档评论(0)

论文资源 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档