基于P2P网络信息检索技术研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于P2P网络信息检索技术研究

基于P2P网络信息检索技术研究   [摘 要]P2P技术具有许多优点,如系统伸缩性好、资源丰富等。P2P网络已成为最流行的文件、信息共享的框架之一,因此高效、稳定的P2P信息检索机制成为目前研究的热点。本文从P2P技术的基本概念入手,讨论了P2P信息检索技术和基于P2P网络的信息检索模型。   [关键词]信息检索 P2P 结构化 分布式   作者简介:李蓬(1975-),男,山东省东营市人,硕士,讲师。主要研究方向:计算机网络及网络安全;黄河(1972),男,安徽淮南人,博士,讲师,主要研究方向:计算机网络性能分析和优化。      一、引言   信息检索是指以一定的策略在互联网中搜集、发现信息,对信息进行提取和组织,从而起到信息导航的作用。根据CNNIC最新统计调查显示,在互联网应用中,信息检索已经排在了第二位,成为仅次于电子邮件的互联网应用。目前如GOOGLE、YAHOO、百度等是人们进行信息检索的常用工具,但这种集中式的搜索引擎远远无法涵盖所有互联网内的共享内容。   P2P对等计算模式(Peer to Peer,简称P2P)是通过在系统之间直接交换来共享计算机资源和服务的一种应用模式。由于不需要依赖集中式服务器的支持,消除了信息孤岛和资源孤岛现象,可以实现信息资源的全面共享。利用P2P技术开发出的搜索工具使用户能够深度搜索文档,目前受到计算机科学界和信息产业界的普遍关注,成为下一代搜索引擎的关键技术。      二、P2P信息检索技术   (一)集中式P2P网络的信息检索   集中式P2P网络中有一个中心服务器,用来记录节点共享内容的索引信息。当用户查找数据时,先搜索索引服务器,然后与其它节点直接建立连接,交换数据。采用集中式P2P形式的软件被称为第一代的P2P系统,其典型代表是Napster。Napster的系统结构图如图1所示。目前,Internet上流行的BT下载也是这种模型的代表。      图1 集中式P2P网络结构   (二)分布式结构化P2P网络的信息检索   在结构化P2P网络中,每个节点都有固定的编址,整个网络具有相对稳定而规则的拓扑结构,如环型、树型等。这类网络采用的信息检索算法如分布式哈希表方法(DHT)。代表性的结构化P2P网络如Tapestry、Chord、CAN等。   (三)分布式非结构化P2P网络的信息检索   非结构化的P2P网络是指网络中节点采用随机的方法加入网络,网络拓扑结构不规则,随节点的变迁而变化。非结构化P2P网络具有可伸缩性、灵活性和自治性等优良特性。在非结构化P2P网络中进行的信息检索的技术主要是洪泛法。代表性的非结构化P2P网络如Gnutella。   结构化P2P网络中存在的缺陷是由于系统中数据的放置位置严格控制,所以维护系统拓扑结构的代价极其昂贵。非结构化P2P网络的缺点是需要覆盖较多的节点,因此需要牺牲较大的通信带宽,不能保证服务质量。在第三代的P2P网络系统中,将采用混合式P2P网络结构。      三、P2P信息检索模型   目前,P2P网络已经逐渐成为最流行的文件、信息共享的框架之一。P2P网络信息检索蕴涵着巨大的商机和应用价值,是未来互联网发展的重要趋势。然而,随着加入到P2P网络中节点的迅速增加以及发布文件的急剧增多,信息无序和信息过载成为一个越来越迫切需要解决的问题。因此,基于P2P网络的信息检索技术成为现在的一个研究热点。   P2P网络信息检索系统是在P2P环境中进行信息检索的系统,是信息检索技术与P2P系统的集成。为了在P2P网络中进行信息检索,我们将P2P网络信息检索系统分为两个层次。一个是P2P覆盖层,该层次的主要功能是维护结构化的P2P网络,进行网络节点消息的转发和节点的定位。覆盖网络中的每一个节点对应一台物理的PC,可以动态的加入和删除,网络覆盖所有的节点组成一个集群。另一个是P2P索引层,该层次的主要功能是处理P2P网络中大量的数据,形成索引并对这些数据进行存储和检索。其结构图如图2所示。      图2 P2P信息检索模型   在上面给出的P2P信息检索模型下,P2P信息检索的过程是:   1.建立P2P覆盖网络,主要完成节点的加入、离开和节点消息的转发等。   2.每个节点对存储在本节点上的内容按照某种分词算法进行索引,以满足本地内容检索。   3.将第二部分的功能加载在第一部分所建立的覆盖网络中的每个节点之上,使得整个覆盖网络能够协同工作实现分布式信息检索。其中检索可以在覆盖网络中的任意一个节点上进行。   4.当用户提出检索请求时,首先在本地检索,如果不存在,则将检索请求发送给自己的相邻节点,相邻节点收到请求后,检查本身是否存在查询的信息,如果不存在,转发查询,直到返回

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档