- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
基于知识图谱开展科研档案的构建与应
用分析
摘要:本文所分析探讨的基于知识图谱科研档案的构建工作,是对档案资源
的聚合方式以及关联关系进行设计,凝练资源类别,挖掘特色要素,突破各类异
构资源的框架格式,对档案知识进行抽取和融合,唤醒科研档案这座“沉睡的宝
藏”,为新型科研档案的智能管理模式和应用提供思路。
关键词:科研档案;知识图谱;智能管理;深层次加工
引言
《全国档案事业发展“十三五”规划纲要》提出档案工作要树立创新、协调、
绿色、开放、共享发展理念,初步实现以信息化为核心的档案管理现代化。尤其
在数据密集型科研范式下的科研档案管理工作,需要新方法和新手段。在当前,
科研活动中人、财、物等各要素之间的关联更加紧密,而科研档案是科研机构在
开展科学研究活动中形成的文字、数据、实物等各种形式载体的历史记录。科学
研究开展过程中生成的数据与资源出现多源异构等特点,致使科研档案管理难度
骤增。
1科研档案管理知识图谱构建
1.1科研档案管理模式设计
目前科研档案管理是基于多源异构数据源,以资源多元化关联为驱动,以数
据深层次加工为基础,以决策支撑与利用为目标,来开展智能化的科研档案管理。
因此,科研档案管理设计思路主要包括多元化关联、深层次加工以及利用支撑3
个层面。在多元化关联层面,通过设计基于科研档案管理的知识图谱模型,定义
科研档案资源中的类、对象属性、数据属性等,将科研活动中的科研人员、管理
人员、科研项目、科研成果等要素与科研档案中的知识单元相关联,通过与外部
知识库如Wikidata的连接,丰富档案资源的语义关系,通过科研档案知识图谱,
提供了一种语义关联组织和管理科研档案知识的思路。在深层次加工层面,选取
合适的命名实体识别和语义关系抽取方法对档案数据开展知识抽取,从知识层面
将科研档案资源中研究任务、考核指标、研究方法等知识单元析出。通过实体消
歧、实体对齐等过程进行知识融合,并与科研档案知识图谱模式互相映射。通过
自然语言处理、机器学习等技术将科研档案文本资源转化为计算机可理解的数据,
抽取出有价值的科研档案知识。在利用支撑层面,分析科研档案管理人员以及相
关科研人员的用户访问行为、页面停留时长、用户检索行为等,为知识推荐等个
性化服务提供基础数据。基于科研档案管理模式的设计可实现科研档案资源从信
息到知识的转变。通过知识图谱的多元化关联可支持科研档案资源中多源异构知
识的有效集成,基于实体识别与关系抽取等技术完成知识细粒度加工与转化,通
过科研档案管理人员等行为分析研究科研档案知识图谱的智能知识应用场景和方
法以支持管理决策。
1.2科研档案知识图谱构建过程
科研档案知识图谱的构建是基于科研档案管理模式知识描述,包含科研档案
实体及语义关系两个构建要素,借助粒度原理、围绕语义网标准设计知识组织的
逻辑和物理结构,实现科研档案多元化关联、深层次加工以及利用支撑等需求。
在多元化关联方面,科研档案的元数据分为人员、组织机构、来源、支持信息、
科研项目以及实体关系六大模块。在开展知识图谱构建时会将档案元数据的一般
属性和特殊属性统筹考虑。科研档案除包含一般档案具有的元数据属性外,还增
加了项目编号、项目来源等项目性质元数据,以及成果类型、获奖级别等科研成
果元数据。科研档案资源各实体间的语义关系包含机构与档案、科研人员与科研
成果的隶属关系,科研人员间的合作关系,科研成果间的引用关系。在深层次加
工方面,基于科研档案特点,结合科研档案语义词典,通过知识抽取的实体识别、
关系抽取等技术可获得科研档案资源语义层面的关键词或高频词。在具体到某个
科研档案的抽取时,需要根据数据特点进一步细化实体。基于科研档案知识图谱
构建过程,通过知识抽取与知识融合等技术,初步构建了科研档案知识图谱。在
查询某类课题时,科研档案知识图谱能够链接到与该科研项目有关的所有档案信
息,包括该项目任务书、结题报告、管理人员信息、研究成员信息、项目成果等
数据。这些数据再关联到其他相关信息,如此连接可实现所有科研档案资源的聚
合。科研档案管理模式的构建是动态循环的。在实例构建过程中,有必要根据需
求及档案资源具体内容进一步细化和丰富各科研档案实体之间的语义关系,从而
准确表达科研档案资源的关联情况。
2科研档案知识图谱应用
2.1知识导航
传统的科研档案系统一般基于档案资源分类层级构建的静态导航。科研档案
知识图谱通过建立科研档案资源关联关系,使档案知识的
文档评论(0)