- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
医学文献领域本体的构建及其关键技术分析,领域本体构建,领域本体,本体论领域是,本体构建,本体构建工具,本体构建七步法,本体构建?10e0?法,医学本体,事件库构建本体
医学文献领域本体的构建及其关键技术分析
本文以构建医学文献领域本体模型为例,阐述了构建医学情报领域本体的基本方法、流程框架和使用工具,并对本体构建过程存在的几个关键问题进行了分析,为医学情报领域本体的建设进行了可借鉴的尝试。
本体(ontology)源于哲学范畴,指的是客观存在的一个系统的解释和说明。1993 年Gruber 为本体下了这样的定义,即“本体是概念模型的明确的规范说明”,后来Studer 等对前人的定义进行深入研究后给出了另一个定义:“本体是共享概念模型的明确形式化规范说明” [ ]。虽然诸多学者对本体概念的定义描述到目前为止还没有达成共识,但是这些概念都包涵了本体的四个共性特征,即:概念化、明确、形式化和共享。“概念化”指的是通过抽象出客观世界中一些现象的相关概念而得到概述模型;“明确”指所使用的概念及使用这些概念的约束都有明确的定义;“形式化”指本体是计算机可读的(即能被计算机处理的);“共享”指本体中体现的是共同的认可和知识,反映的是相关领域中公认的概念集,即本体针对的是社会范畴而非个体之间的共识[ ]。
同时,N.Guarino 提出将本体划分为顶级本体(top-level ontology)、领域本体(domain ontology )、任务本体(task ontology)和应用本体(application ontology )[ ]。领域本体是指描述特定领域中的概念以及概念之间的关系,是用于描述指定领域知识的一种专门本体。它给出了领域实体概念及其相互关系,是领域话动以及该领域所具有特
性和规律的一种形式化描述[ ]。一个领域本体包括一套关于某一领域概念的规范而清晰的描述,称为类(classes)或概念(Concepts);描述了有关概念的各种特征的属性(properties)和属性插件(slots),还包括属性插件的限制条件(restrictions)和分面(facets),以及一系列与某个类相关的实例(这些实例组成了一个知识库)。类是本体的核心,它描述了某一领域的概念。属性插件描述了类的属性和实例[ ]。目前,本体模型的研究已经进入了一个新阶段,许多研究领域都在建立自己标准的本体。
1 学科领域常用本体构建方法和建设工具
1.1 学科领域常用本体的构建方法 由于本体工程到目前为止仍处于探索阶段,领域本体的建设还处于探索期,构建过程中存在着很多问题。中科院的李景博士在《本体理论及在农业文献检索系统中的应用研究-以花卉学本体建模为例》中对目前常见的7种本体构建方法的成熟性进行了排序,即七步法、METHONTOLOGY 法 IDEFS 法TOVE 法 骨架法 SENSUS 法、KACTUS 法。本文大部分过程借鉴了七步法的思路和流程。
1.2 学科领域本体常用建设工具 到目前为止,已经出现了许多本体建设工具。根据这些工具所支持的本体描述语言,大致可以分为2类。第1类包括Ontolingua,OntoSaurus,WebOnto等。这3个工具的共同点是,都基于某种特定的语言,并在一定程度上支持多种基于AI的本体描述语。第2类包括Protégé 系列、Web0DE、OntoEdit、Oi1Ed等。这些工具最大的特点是独立于特定的语言,可以导入/导出多种基于Web的本体描述语言格式(如XML、RDF(S)、DAML+OIL等)。它们都是基于组件的结构,很容易通过添加新的模块来提供更多的功能,具有良好的可扩展性[ ]。
本文之所以选择Protégé 作为构建工具,是因为Protégé与其他本体创建工具相比,有很多其独特的优势:①Protégé 作为开源工具,目前拥有最多注册用户;②不断有新的版本推出;③可扩展性好;④以多种方式存储本体、互操作性强;⑤图形化的用户界面,简单友好;⑥支持DAML+OIL,OWL,RDF,RDFS等本体表示语言。正是这些优点,使得Protégé 成为各种领域本体构建的首选工具。
2 医学文献领域本体的构建
2.1 医学文献领域本体的构建规划 在真正开始构建领域本体之前,要首先明确需求分析和计划制定阶段主要几个问题:①在哪个领域构建本体?在医学文献领域,主要侧重图书情报界对医学文献的分类和处理。②构建本体的目的什么?从概念之间关联的角度,深层次地揭示领域的信息,实现该领域文献集的基于知识结构的导航。③选择什么样的本体描述语言?采用OWL描述该领域本体,标注XML文档。④选择什么样的构建工具?本体的构建工具选择Protégé 作为本体创建工具。
2.2 医学文献领域本体的构建过程
2.2.1 列出医学文献领域本体中的重要概念 根据分类法、中图法和《我国数字图书馆标准与规范建设》项目(CDLS)的相关标准,并且在请教解放军医学图书馆相关馆员的基础上,确定了与“医学文献”最为相关
文档评论(0)