基于Ontolgy 的智能检索技术研究与实践.docVIP

  • 5
  • 0
  • 约1.37万字
  • 约 9页
  • 2016-10-04 发布于贵州
  • 举报

基于Ontolgy 的智能检索技术研究与实践.doc

基于Ontolgy 的智能检索技术研究与实践

基于Ontology的 Method of Development and Architecture of an Ontology-Based intelligent retrieval System 胡正银 ,方曙 ,郑颖,钟秀琴(四川大学公共管理学院,中科院国家科学图书馆成都分馆,中科院成都计算机应用研究所成都 610041) 【摘 要】:本文,了方法体系结构。:、、、、。,、,。【关键词】:本体; 【中图分类号】 G250 【文章标识码】 A 引言传统的学科信息门户多提供基于学科分类的资源导航服务与基于关键词匹配的检索服务,由于信息之间缺乏语意的关联,因此很难提供基于知识的服务。基于本体的智能检索技术在传统的关键词匹配检索的基础上,通过添加了语义层,可实现基于语义的智能检索,目前已成为研究的热点[1]。虽然基于ontology的智能检索技术研究仍处于发展的前期,还有很多研究难题,但其已经引起了包括图书情报界在内的广泛关注。系统体系结构以语义网七层体系结构为参考,基于本体的智能检索系统结构如下[2] : 接口层 (提供用户和应用程序接口) 查询层 (在语义图的基础上,实现智能查询) 推理层 (提供基于规则的知识推理和知识发现的功能) 语义图层 (对概念进行语义描述,用定义的关系连接各种概念,并对数据库中的资源进行语义映射,建立领域知识的核心语义图) 数据层 (有机地整合多源数据和通用本体,并提供远程访问接口) 图 基于本体的体系结构图 Fig “ontology-based intelligent retrieval” architecture diagram 1、数据层:有机地整合多源数据及通用本体等,并提供远程访问其它相关数据的接口。 2、语义图层:在已有数据库及文献资料等资源的基础上,采用RDF,OWL等描述语言对数据库的各类数据和资源进行语义描述和关系映射,建立一个领域知识的核心语义图。该语义图可扩展、可读写、可推导。逐步构建领域的本体[3]。 3、推理层:推理规则的提取与描述,利用推理引擎如:Jena或RacePro或RDF Prolog等,实现知识推理和新知识发现的功能。 4、查询层:在语义图的基础上,利用推理功能,根据数字图书馆知识服务的需要,可建立知识查询服务。 5、接口层:在一个查询界面下实现跨数据库查询和数据整合,使得用户查询更加便利和全面,提供用户和应用程序接口。本文以AllegroGraph知识库管理系统为基础,以AllegroGraph知识库系统自带的RDF Prolog语言作为推理规则描述语言,在Java环境下实现了一个基于本体的智能检索演示系统,具体方案描述如下: 1、 数据层:在中药专家的指导下,以《中国中医药主题词表》[4] ,《中国大百科全书·中医》[]中医卷,国科图成都分馆自建的天然药物数据库相关内容,作为本系统的数据源。主要涉及的数据包括:中草药的分类及其味,性,效等属性中药方剂分类疗效及组成等属性。2、 语义图层:采用OWL描述语言对描述,。中草药,中药方剂实例的映射关系,领域核心语义图。 在本体的建设过程中,根据中医药主题词表的分类标准,采用自上而下的设计方法。如在定义中草药类时,先定义中草药类,然后按照其疗效分别定义:安神药,补益药,解表药等类,最后才在子类下面定义具体中草药实例[4] []。 中草药本体的结构设计如图2: 图结构图 Fig “herb demo ontology” architecture diagram 其中中药类特定属性包括:品名、别名、性(寒、热、温、凉)味(辛、甘、酸、苦、咸)、功效、应用等;方剂类的特定属性包括:成份、主治等;中医病症类的特定属性包括:症状等。 在设计概念及实例之间相互关系时,除了owl中内置的上下位关系 subclassof 、同一关系:SameAs、 类-实例关系:Individual外,部分定制关系如表1:表1 本体部分属性 Table1 Part of the Meridians Ontology’s Attributes谓词 Domain Range 举例 iscomponent 中草药 方剂 陈皮是纯阳正气丸配方的一部分 usezy 方剂 中草药 纯阳正气丸配方中有陈皮这味药 cancure 方剂 病症 纯阳正气丸能治疗寒湿症 病症病症Protégé或TBC编辑器建立本体文件。本体数据持久化三种方式:文件存储、传统关系型数据库存储、RDF三元组存储[] [7] [8] :表Table2 Method of the ontology storage 持久化方式 特点 文件存储轻便快捷,适合于小型的本体库。不需要过多的配置,便于备份,复制,编辑,且查询速度快。缺点在于

文档评论(0)

1亿VIP精品文档

相关文档