基于本体信息检索系统研究.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于本体信息检索系统研究

基于本体信息检索系统研究   摘要:搜索引擎在查全率和查准率方面难以完全满足用户的实际需求。本文引入本体技术,以图书信息的查询为例,通过构建图书信息的本体属性架构,在图书信息的检索中引入本体的技术,从而极大地提升图书查询的准确性和效率,使图书馆能够为用户提供更高品质的服务打下基础。   关键词:本体 信息检索 搜索引擎   中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2013)07-0043-01   1 引言   随着信息技术发展与应用的不断深入,网络已经成为世界范围的信息源。与之相伴的是信息检索问题,怎样实现在海量网络信息中获取符合用户需求的信息,是信息检索界亟待解决的课题。本文以图书信息的查询为例,从而极大地提升图书查询的准确性和效率,使图书馆能够为用户提供更高品质的服务打下基础,本文的成果具有比较好的理论价值与实践意义。   2 本体技术概述   本体是以系统化的方法来描述客观世界的事物,从而能够实现事物中所包含元素的集成和重用,从而将信息抽象为知识。在对事物的描述中,本体将所有的事物分解为不同的概念,并准确地定义概念之间的逻辑联系。当前,作为一种信息技术的实现方法,本体论在计算机领域中具有比较重要的价值与意义,正在一些领域有着比较广泛应用,包括语义网络的实现、智能搜索的设计、异构数据的整合、以及GIS系统和图书馆的数字化等。在这其中,语义网络的研究和应用是一个热点。   3 基于本体的信息检索设计与实现   3.1 系统框架设计   结合目前应用比较广泛的B/S的结构体系,本研究所涉及的信息检索结构分为三个层次,下面分别进行阐述:(1)应用层的设计。在基于本体的检索系统中,应用层的功能是处理用户需求,实现用户和系统的交互。在应用层中,通过用户界面的表单来处理用户所输入或者选择的查询请求,对请求的格式进行初步处理之后传输至逻辑层进行进一步的处理,并将由逻辑层传输到本层的检索处理结果向用户显示。(2)逻辑层的设计。逻辑层是检索系统对查询和检索结果进行处理的核心部分,主要功能有:用户查询的生成、用户查询条件的表达??用户查询的执行。逻辑层的设计成股份考虑到了检索内容的本体模型与查询处理之间的匹配。(3)数据层的设计。数据层的功能是对系统的数据进行存储,针对本文所研究的图书信息而言,将会为所有的图书数据构建一个基于本体的数据库,本研究选择的是sql server数据库。在数据库中,结合本体库知识对所存储的信息以及信息之间的联系进行标注,从而使图书信息能够以本体的规范进行存储,以便查询。   3.2 检索方法的设计   当前,无论是基于哪一种搜索引擎,具体的检索结果往往难以保证足够的查全率和查准率。其核心原因在于:首先对没能准确地表达用户的查询需求,导致信息系统难以精确地把握查询需求;其次是系统是以机械匹配的方式来处理用户所输入的检索关键词,因此没能对所查询的语句进行必要的扩展。所以本研究所涉及的基于本体的检索方式的设计基本思路为:(1)基于本体对于事物的描述,首先对用户所输入的查询条件进行整理和优化,把其查询条件进行转换,使之能够体现为本体的概念以及本体元素之间的联系。(2)结合本体的信息处理模式,对转换之后的查询条件进行概念上的扩展,最终形成符合本体属性和特点的查询式,开始查找,并得到结果。   3.2.1 基于本体的检索优化方案设计   此处将用户查询条件所属的原始概念空间定义为{C,R},在该空间中,C的涵义是查询条件所包含的全部概念项,R的涵义是全部概念项之间所拥有的逻辑关系。在本体的设计理念下,本研究把检索优化的步骤定义为(1)把概念项空间C里用户的查询概念进行转化,使之成为本体类型的概念,从而构建基于本体的概念;(2)结合查询概念之间的逻辑关系R,对查询条件进行逻辑转换,从而构建符合本体模式的优化概念空间。   在(1)中,首先设概念项空间C里所包含的概念项是(C1,C2,C3,C4,C5……),针对里面的所有概念项,在已经构建的本体知识库里搜索与这些概念项匹配的概念,所有的同义词以及词性变换均能够生成新的记录,以(Ci,Oi)表示。记录中,Ci的涵义是概念项(C1,C2,C3,C4,C5……)中的一个元素,Oi则表示图书信息本体里和Ci匹配的概念,可知在这样的模式之下,每一个概念项均可能有多个与之匹配的概念,而所有的匹配概念最终形成新的概念集O。当前概念相的匹配完成之后,则进行针对查询条件的逻辑转换,最终通过一套逻辑转换规则形成新的逻辑关系。   3.2.2 检索的语义扩展   在对用户的查询条件进行本体话处理之后,有可能会出现无法找到与之匹配的概念的情况,这时候需要对检索进行语义的扩展。扩展的目的是从一个概念延伸到其他概念,以及从一个属性眼神至其他

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档