基于小世界现象的P2P网络搜索研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于小世界现象的P2P网络搜索研究.doc

基于小世界现象的P2P网络搜索研究   摘 要:本文依据小世界特性提出了一种P2P网络搜索引擎系统模型,并给出了系统模型中对等网络节点的拓扑结构,提出了一种搜索机制,使查询消息更高效的传播,实验数据说明本文搜索机制与洪泛算法相比更加有效。   关键词:小世界; P2P网络;搜索;簇   中图分类号: TP393.2 文献标识码:A   1 引言(Introduction)   非结构化P2P[1]在搜索方面的优势,引导人们开发基于对等网络的强大的搜索工具。其广泛采用的洪泛(Flooding)搜索机制[2],查询从一个节点以广播方式传播到其他节点,直到查找到查询结果,从而导致每次查询都产生大量的网络流量,对网络造成很大的负担,影响了非结构化P2P系统的扩展性。本文依据P2P网络的小世界现象,提出一种搜索机制,以提高查询效率。   2 小世界现象(Small-world)   小世界[3,4](SW:Small-world)现象简单地讲就是社会网络中任意两个陌生人之间,经过较少的中间相识者就有可能建立起联系。这种现象在社会科学中发展成为一个重要的研究领域以后,经过许多次成功实验,证实在一个成功的通信链中,中间步骤的平均数总在5和6之间,称为“6度原理”。一些文献表明,P2P网络有时会自动演进到一个小世界[5]。   基于小世界现象构造的模型称为小世界模型,小世界模型基于这样一个原则:每个节点都表现出某些可以捕捉到的兴趣,兴趣相近的节点所保存的内容和提交的查询呈现出一定的相关性,通过挖掘每个节点的兴趣,使得相关性高的节点在网络中比较接近。这种按照节点间相关性组成的网络所表现出和社会网络相近的特性――具有较高的聚集度和存在短链,即所谓的小世界特性,小世界特性被证明对于提高检索效率是非常有效的。   3 基于小世界现象的P2P网络搜索引擎模型(P2P   network search engine model based on small   world phenomenon)   P2P网络的搜索引擎关键是对共享内容的深度挖掘,在对等节点之间进行信息检索时快速高效地进行信息反馈,要求寻找网络中对等节点之间的短路径。   在P2P网络搜索引擎系统模型设计时,考虑小世界模型簇聚合以及存在短链特点。簇聚合意味着具有度数较高的对等节点,这类对等节点在网络中的连通性较好,作为搜索引擎中的索引服务器保存文档的索引信息。存在短链意味着能够通过短链进行信息的检索和作为反馈路由。同时还考虑网络中资源信息本地化管理,资源信息搜索由本地网络发起进行全局检索,结合小世界模型构建如图1所示的小世界P2P网络搜索引擎系统模型。   图1描述的搜索引擎系统模型以P2P小世界网络为中枢,将信息搜索和对等点中共享的资源信息联系起来,整个系统模型分为三个层次:用户层(用户界面)、网络层(缓存、P2P网络、信息搜索和文件传输)以及文件处理层(文件处理和共享)。系统模型中信息搜索模块采用语义检索算法进行文档资源的信息搜索;文件传输模块主要是把文档进行分组传送和一般的网络数据传输相同;界面模块主要是采集用户查询请求。   5 实验分析(Experimental analysis )   5.1 实验条件   模拟实验在自行构造小世界网络拓扑中进行文档的中文文档主题搜索,即搜索符合查询请求的文档主题信息,网络拓扑和文档主题数具体实验参数如表1所示,在构造的网络拓扑上实现泛洪式的Query Routing算法和本文提出的使用小世界网络中度数较高的节点进行关键字查询搜索,从查全率和查询产生的消息量两个方面对两种搜索方式进行比较。   实验中按照关键字进行查询,将文档主题进行简单分词处理,并对分词得到的关键字在每个节点中建立索引,在小世界网络中度数较高的节点对本簇中所有节点的关键字建立索引关联文件,将关键字、文档ID源文档IP地址和源文档端口号建立联系,实现快速定位,索引关联文件结构如表2所示。   5.2 实验结果及分析   实验1控制TTL值,随机选择20个节点发起查询,统计每次查询产生的查询消息量,最后计算平均值,实验结果如图3所示。   实验结果表明在相同TTL值的条件下本文提出的搜索机制搜索产生的查询消息量比Query Routing算法泛洪式搜索产生的查询消息量少。   实验2控制TTL值,随机选择20个节点发起查询,统计每次查询返回的文档主题数量,最后计算平均值,实验结果如图4所示。   实验结果表明在相同TTL值的条件下本文提出的搜索机制查询返回的文档主题数量比Query Routing算法泛洪式搜索返回查询结果数量多。   从实验中可以得出如下结论:在自行构造的小世界网络中,在相同TTL相同的情况下,本文使用度

文档评论(0)

ganpeid + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档