基于P2P网络资源搜索技术研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于P2P网络资源搜索技术研究

基于P2P网络资源搜索技术研究   [摘要]对P2P资源搜索的拓扑结构和资源搜索算法等相关知识作较详细的介绍,对基于不同P2P结构的搜索算法作简单的对比和分析。并针对现有搜索算法存在的问题,提出一些解决的设想,最后对影响搜索算法的因素和解决的方法进行归纳。   [关键词]P2P资源搜索   中图分类号:TP3文献标识码:A文章编号:1671-7597(2009)0920068-01      一、引言      P2P即端到端网络应用,又称为对等连接或对等网络,是一种新的通信模式,P2P网络中的节点是对等的,且每个peer能同时充当服务器和客户端。   在P2P网络中,不存在中心服务器,所有的节点既是客户机,享用其他节点提供的服务,同时又充当服务器,为其他节点提供服务。P2P对等的节点之间进行直接的连接与共享,因此搜索无需通过Web服务器,也可不受任何信息文档格式和宿主设备的限制,可以达到传统搜索引擎无可比拟的深度,理论上可以包括网络上所有的信息资源。现阶段互连网上大量资源被闲置,没有被充分利用,P2P搜索技术可以帮助人们方便地找到所需资源。      二、P2P资源搜索技术      为了在P2P网络中有效的发现资源,人们对P2P搜索技术做了大量的研究。目前主要从P2P网络的结构以及采用的算法两方面进行研究。P2P网络可分为两类:结构化网络和非结构化网络。在结构化网络中每个结点存储的信息与网络拓扑结构有关,通过映射完成,查找采用基于DHT分布式散列路由搜索算法。而非结构化网络则与网络拓扑无关,其结点可任意存储信息,查找采用基于广度优先的搜索算法及其改进算法。   (一)结构化P2P网络的资源搜索技术   结构化P2P网络是指像CAN、Chord、Tapestry之类的点对点的网络。这类网络中每个节点都有固定的地址,整个网络具有相对稳定和规则的拓扑结构。依赖拓扑结构,可以给网络的每一个节点指定一个逻辑地址,并把地址和节点对应起来。动态散列表是大多数结构化P2P网络所采取的资源定位方式。首先将网络中的每一个节点分配虚拟地址(VID),同时用一个关键字(KEY)来表示其可提供的共享内容。取一个散列函数,这个函数可以将KEY转换成一个散列值H(KEY)。网络中节点相邻的定义是散列值相邻。发布信息的时候就把(KEY,VID)二元组发布到具有和H(KEY)相近地址的节点上去,其中VID指出了文档的存储位置。资源定位的时候,就可以快速根据H(KEY)到相近的节点上获取二元组(KEY,VID),从而获得文档的存储位置。不同的DHT算法决定了P2P网络的逻辑拓扑,比如CAN就是一个N维向量空间,而CHORD是一个环形拓扑,TAPESTRY则是一个网状的拓扑。   基于DHT这类结构搜索算法最大的问题是DHT的维护机制较为复杂,尤其是结点频繁加入退出造成的网络波动,极大地增加了DHT的维护代价。这类搜索算法存在的另外一个问题是DHT仅支持精确关键词匹配查询,无法支持内容、语义等复杂查询。这是由于其采用相容散列函数根据精确关键词进行对象的定位与发现,散列函数总是试图保证生成的散列值均匀随机分布,结果两个内容相似度很高但不完全相同的对象被生成了完全不同的散列值,存放到了完全随机的两个结点上。目前在DHT基础上开展带有语义的资源管理技术的研究还非常少。也正是由于DHT的精确关键词映射的特性决定了无法和信息检索等领域的研究成果结合,才阻碍了基于DHT的P2P系统的大规模应用。   (二)非结构化P2P网络的资源搜索技术   非结构化P2P网络指的是以Gnutella为典型代表的一类网络。Gnutella   是更加纯粹的P2P系统,因为它没有中央索引服务器,每台机器在Gnutella   网络中是真正的对等关系。非结构化P2P网络的搜索技术按照搜索策略可以分为两大类:盲目搜索和启发式搜索。盲目搜索通过在网络中传播查询信息并且把这些信息不断扩散给每个节点,采用泛洪方式来搜索想要的资源。而启发式搜索在搜索的过程中利用一些己有的信息来辅助查找过程,因此能较快找到所需的资源。   1.Flooding搜索方法。在最初的Gnutella协议中,使用的是Flooding,又称为宽度优先搜索方法。在网络中,一个节点向所有邻居节点广播查询消息,邻居节点再向自己的邻居节点广播,这个过程不断进行下去,像洪水在网络中各个节点流动一样,所以叫做Flooding搜索。搜索的节点开始给TTL。赋一初值,它每传播一次TTL减1,如果TTL减到0还没有搜索到资源,则停止。如果搜索到资源则返回目标机器的信息以用来建立连接。在搜索过程中可能出现循环,当TTL=0的时候循环自然结束。该算法的特点:路由算法比较简单,易于实现。每次路由都是全网遍历,增

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档