基于分布式结构网络资源检索设计与实现.docVIP

基于分布式结构网络资源检索设计与实现.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于分布式结构网络资源检索设计与实现

基于分布式结构网络资源检索设计与实现   摘要系统是建立在j2ee三层架构之上的网络资源检索系统,以XML格式的文本存储数据,在分布式的条件下,检索出用户需要的信息。系统分为四部分:启动、分布式检索以及结果汇总、预览、管理和配置。系统在实现过程中突破了多个技术难点:分布式结构――选举注册发布的建立和维护;中文分词;对检索结果的二次处理等。   中图分类号:TP393文献标识码:A      0 引言   目前,网络上存在大量的资源共享服务器,这些服务器一般存储了一定量的资源,并以web服务的方式供用户和其它服务器访问。现存的问题在于不同服务器的资源组织方式往往不同,有的是通过数据库,有的是通过一些描述文件(如XML),而且数据库的种类和结构也有很大的差别,这就导致不同服务器之间资源共享和资源发现都十分困难。同时,企业信息资源布局分散、类型异构,导致在企业内部各部门资源共享和全局应用存在很多困难,多主机的资源共享和集成也是企业信息资源系统的需要。   用户如果想访问这些资源,就要登陆每一个服务器去检索和下载需要的资源。由于服务器的分布广泛,数量众多,用户显然难以检索到自己需要的资源。而分布式的资源检索策略则可以有效的解决这一问题。该策略的思想是当用户登陆任何一台服务器的时候,这个服务器除了要检索自己本地的资源以外,还可以作为一个客户端,自动地去连接其它服务器,发出检索请求,并将检索的结果进行合并和汇总,返回给用户。这样,用户只需要登陆任意一台服务器,就可以检索到大量所需资源,尽管这些资源来自于不同的服务器,但检索的过程对用户来说是透明的,用户检索和获取这些资源就如同检索和获取所请求的服务器上的资源一样。   1 基于分布式结构的网络资源检索的设计与实现   1.1 系统分析   在多台资源共享服务器之间,实现资源共享,消除资源孤岛,其规模并不是主要因素。此时的共享与传统的共享已有很大不同,更具目的性。目的性体现在它已经不再是简单的资源互连和单一使用,而是通过互连、组合、协作解决用户需要解决的问题,产生具有附加值的新服务、数据、信息等资源,满足用户的新需求。   资源共享和整合的服务器存在的环境具有异构、分布、动态、演化的特点,这主要体现在虚拟组织、资源的异构、分布、动态、演化特性以及共享模式、协同方式的变化上。因此,如何实现如上述实现用户透明访问的分布式框架,需要解决很多的问题。   (1)异构:不同服务器资源组织方式和检索方式的异构性。资源的描述和存储方式各有不同,有的通过各种数据库,有的则通过一些资源描述文件来组织其本地资源。(2)分布:大量资源往往分布存储在大量不同的服务器上,服务器处于不同的网络之中,其网络结构和拓扑千差万别。(3)动态:网络结构的动态变化。服务器的在线和离线,资源动态的加入和退出是分布式检索需要解决的重要问题。(4)演化:资源服务器有时带有一定的层次性,可以组成各种网络结构。   正因为资源共享服务器之间有这样的关系,分布式信息检索是解决这种服务器之间共享问题的有效方案。图1显示了分布式信息检索系统的结构。      图1分布式信息检索系统的结构   1.2 系统设计   1.2.1 系统架构   采用MVC的三层架构(如图2所示):   (1)从开发角度和应用角度来看,三层架构比双层或单层结构都有更大的优势。三层结构适合群体开发,每人可以有不同的分工,协同工作使效率倍增。开发双层或单层应用时,每个开发人员都应对系统有较深的理解,能力要求很高,开发三层应用时,则可以结合多方面的人才,只需少数人对系统全面了解,从一定程度上降低了开发的难度。(2)三层架构可以更好的支持分布式计算环境。逻辑层的应用程序可以有多个机器上运行,充分利用网络的计算功能。分布式计算的潜力巨大,远比升级CPU有效。(3)三层架构的最大优点是它的安全性。用户端只能通过逻辑层来访问数据层,减少了入口点,把很多危险的系统功能都屏蔽了。   1.2.2 基于XML的元数据搜索引擎   在每一个资源节点上,节点的管理程序会随着其所属的本地资源的变动维护一个XML文档,它的作用实质上是充当一个资源发言人的角色。   通过这样一个XML文档,可以得到这个资源节点所管理的所有资源的信息,包括资源的描述信息和资源的地址信息。因此,对资源的检索过程也就转化为对这个XML文档内容的检索过程。   对分布式检索思想进行抽象,本文对定义网络资源检索的分布式框架:定义一个基本字符检索元BCR为一个包含检索空间集RS,检索条件字符串RC和检索结果集RR的一个三元组,即BCR= 。RS可以看作是资源网格中该检索域所包含的全部资源。RC是用户提交的检索字符串。RR是一次检索的返回结果集合。提出分布式的检索模型,即要将RS分

您可能关注的文档

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档