[医学数字资源语义互联模式研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[医学数字资源语义互联模式研究

医学数字资源语义互联模式研究 [摘要]在充分复用丰富的医学知识组织体系基础上,构建以umls为主导的多本体融合的医学数字资源语义互联模式,即一种基于全局本体统控、多种本体融通的模式框架。以umls为主导的多本体融合模式由三个基本层和两个链接层构筑。从umls本体的全局统控、多本体融合的语义标引机制、多本体融合的语义检索模式、多本体融合的信息集成构架这4个方面详细阐述医学数字资源语义互联的机理。从自然语言处理、智能检索、本体学习、知识发现和专业知识聚类等方面分析医学数字资源语义互联的功能。 [关键词]语义互联 本体 全局本体 umls 1 引言 语义提取、语义分析、语义检索、语义集成和语义互操作已经成为当前语言学、逻辑学、图书馆学情报学、计算机科学等领域的研究热点。各领域从不同角度进行理论探讨和技术挖掘,力图进一步推动数字资源的语义互联和语义互理解。随着本体理论的日趋深入和本体技术的渐臻发展,本体作为一种蕴含知识间语义关系且能在知识层提供知识共享和复用的工具已经得到共识,以本体为知识组织核心的语义检索成为主要研究方向,并已积累了一定的研究成果。在此基础上,专家学者开始探讨本体在知识管理、语义互操作、决策支持和推理中的应用,并探讨本体促进数字资源语义互联的模式、机制并构建实验性系统。在医学领域,由于美国国立医学图书馆长期的积累,已经形成世界范围公认的知识组织体系,包括科学的叙词表、各种本体、医学术语标准、国际分类标准等。这为医学领域的数字资源进行语义互操作奠定了基础,为整合分散的、异质的各类生物医学数据源提供了保障。本文整合各种领域本体,集成各领域本体中的概念、术语和概念之间的语义关系,提出了医学数字资源语义互联模式——以umls为主导的多本体融合模式。 本文的研究意义在于促进各种知识本体在医学信息领域中的有效共享,为建立智能化的医学临床科研融合系统提供基础性研究,为进行深层次的医学数据挖掘与服务提供理论支持。 2 医学数字资源语义互联模式 umls(the unified medical language system)是美国国家医学图书馆(national library of medicine,nlm)设计和维护的一体化医学语言系统。umls词表已成为词典标准在生物医学知识中共享,并被应用于生物医学数据库的信息提取和集成、本体的语义集成等。鉴于此,在构建医学数字资源语义互联方面,充分利用专家对umls在描述概念方面已取得的研究成果不失为一个捷径。 医学数字资源语义互联模式是以umls为主导的多本体融合模式,其充分考虑了umls在描述概念和语义集成方面的优势地位,为生物医学用户提供了统一的语义空间。在该语义空间中,异构数字资源通过语义标引实现语义互理解,用户可以对生物医学文献、生物医学数据库、临床数据进行数据挖掘、数据集成、决策支持、自然语言处理和知识发现,实现对知识的智能服务和共享。该模式是一种基于全局本体统控、多种本体融通的数字资源语义互联模式框架,见图1。在该模式中,每一种本体发挥他们各自在数据挖掘、语义分析、语义检索方面的作用,充分体现出本体的复用以及对现有知识组织体系的再利用;另外,该模式将提供词典标准的umls作为全局本体,形成共享的词汇集,从而保证本体之间的语义互理解。 3 医学数字资源语义互联的结构 以umls为主导的多本体融合模式由三个基本层和两个链接层构筑。 3.1基本层 ·用户层。该层是系统与用户的交互接口,用户通过应用接口层对异构数据源进行语义查询、数据挖掘等操作。 ·语义层。该层是系统的核心层,是以umls为主导的多本体融合数字资源互联模式的关键所在,该层以umls为全局本体,通过本体映射和本体集成方法与工具复用医学生物学领域本体。 ·数据源层。该层集成异构数据,包括临床数据、实验数据、基因(蛋白质)数据、文献数据和网页数据。 3.2链接层 ·知识管理层。该层位于数据源层和语义层之间,在该层上,本体作为一种词汇来源支持对数据和资源的标引注释、检索和跨医学信息资源和本体的映射,反映数据资源层与语义层的交互。 ·决策支持与推理层。该层位于用户层与语义层之间,在该层上,本体作为一种语义核心集支持对自然语言的处理、数据的集成、决策支持以及知识发现。 三个基本层是医学数字资源语义互联的根本和目的所在,两个链接层是数字资源语义互联功能和智能的体现。 4 医学数字资源语义互联的机理 4.1umls本体的全局统控 医学知识本体为用户、资源和服务提供了信息交互的理解平台,为信息共享提供了可能性。目前,国际上开源的生物医学领域本体大体分为4种:基于医学信息检索的本体类型(umls、mesh),基于生物医学数据的本体类型(obo系列本体、go),基于临床医学的本体类型(opengalen、转化医学本体tmo),

文档评论(0)

lisufan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档