基于ontology信息检索技术研究.docVIP

下载本文档

2
0
约2.69千字
约 7页
2018-08-28 发布于福建
举报
版权申诉

基于ontology信息检索技术研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于ontology信息检索技术研究

基于ontology信息检索技术研究　　【摘要】：文章介绍了基于ontology的信息检索系统系统需求分析，然后阐述了系统数据库设计的方案，最后详细描述了基于ontology的信息检索系统--期刊检索系统的实现。　　【关键词】：ontology；期刊检索系统；信息检索系统　　中图分类号：TP311 文献标识码：B 文章编号：1002-6908(2008)0610066-01 　　　　一、ontology在信息检索中的应用　　　　由于自然语言的灵活性和人们看待事务的角度不同会导致对同一概念的不同表达形式，即使用不同的词汇表达相同或相近的概念，例如计算机可以称为电脑、个人电脑、微机、微型计算机、PC等。这对于信息检索的查全率和查准率都会有很大的影响。一般情况下，用户所提出的查询请求是一个简单的词或者词组，当系统接受到该查询请求后，需要首先对其进行语义化处理。通常处理考虑如下3种情况: 　　(1) 同义词关系(Synonym):词与词之间的意思相同或非常相近，往往可以相互替换，如计算机和电脑，计算机网络与计算机网。　　(2) 上下位关系(Broader Terms/Narrower Terms):最顶端的上位词就是族首词，下位词是上位词的特例，如检索系统模型与布尔检索模型、向量空间检索模型、概率检索模型的关系，它们的族首词都是情报检索。在检索中有的时候通过该概念的上下位概念也能检索到潜在的有用信息。　　(3) 概念的歧义:一词多义的现象。例如:笔记本即可以指笔记本电脑，又可以指平常写字的笔记本。为了排除这些歧义干扰，应该将这些概念按主题分类。ontology具有良好的概念层次结构和对逻辑推理的支持，它提出了对特定领域知识的共同理解，抽象出该领域内共同认可的词(概念)，并给出这些词(概念)及它们之间相互关系的明确定义。基于ontology的信息检索优于关键词搜索，因为ontology包含机器可以判断的概念的定义，从而使系统对领域内的概念、概念之间的联系及领域内的基本公理知识有一个统一的认识，系统通过分析用户提出的查询中所包含词(组)的语义，理解用户的查询，并准确地映到信息资源，从而提高了信息检索系统的查全率和查准率。　　　　二、系统需求分析　　　　期刊检索系统的主要任务是为用户提供一个统一友好的检索平台，用户可以根据自己的需求，使用不同的检索方式和检索方法进行检索，系统会将检索到的所有期刊资源结果反馈给用户。从用户需求角度来分析期刊检索系统的功能需求，系统应满足如下要求: 　　(1)系统应该提供良好、方便的检索功能。只有提供了丰富的期刊资源信息，才能真正方便广大师生员工，为教学工作服务。且检索应该提供多种检索形式，满足不同的用户需求。　　(2)系统应该提供良好的管理功能。管理员应能够很方便地对系统进行维护和管理。　　(3)系统应具备良好的安全性。系统应具有良好的安全机制和保护功能，防止外来人员或不具备操作权限的人员对数据库进行非法改动或破坏。　　　　三、系统总体结构设计　　　　系统总体结构设计是在需求分析的基础上对系统进行逻辑结构的划分，具体地说就是根据系统所具有的功能划分系统的层次结构，确定各层次及层次内各部分间的功能分配，并确定各层次及部分间的相互关系。本系统采用浏览器/服务器(Browser/Server，简称B/S)模型，它提出一种将软件系统按照逻辑分层的规划方案。本系统可分为三层，即:数据层、业务处理层和应用层。其优点主要是，其一:开发人员可以从分布式应用程序的建立等所需要的工作中解脱出来，把精力更多的集中在业务解决方案上。其二:本系统按层次分开之后，通过更改相关层次来实现功能的改变，由于各层次具有相对的独立性，更改某个层次将不会对其它层次产生影响。如图1。　　　　1. 应用层　　应用层作为期刊检索系统的客户端，主要提供完整的人机应用界面。应用层通过浏览器上的操作向业务处理层发出检索请求，在经过与业务处理层的通信后，接收来自业务处理层的反馈结果。还具有接受业务处理层的约束，依据用户不同的要求提供不同的用户界面。　　2. 业务处理层　　业务处理层是联系应用层和数据层的桥梁，响应客户端发来的请求，执行某种任务并对相应的数据进行处理，进行系统维护与系统管理，提供对外接口，保障系统安全，调用数据库服务器完成对数据库的操作。它负责系统的流程控制，根据来自应用层的请求，激活相应的业务逻辑，并选择需要显示给客户的应用界面层，通常用JSP/Servlet技术来实现。业务处理层还负责封装系统内部的状态以及改变这些状态的动作，用来完成业务逻辑处理，系统采用JavaBean技术来实现。　　3. 数据层　　数据层提供数据的存储。数据层负责将数