- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于标签匹配的P2P信息检索算法.doc
基于标签匹配的P2P信息检索算法 摘 要:对于非结构化P2P网络而言,资源的高效搜索成为广泛研究的关键技术。本文提出了一种基于标签匹配的信息检索算法,将请求表示为多关键字向量,对请求和资源信息的标签进行匹配,并对搜索结果进行评分排序,选取符合要求的信息。本算法充分考虑了多种因素对搜索效率的影响,大大提高了搜索结果的精确性。 关键词:非结构化P2P网络;标签匹配;权重;评分排序 中图分类号:TP393.02 1 研究现状 P2P(peer-to-peer,点对点)网络是当前十分流行的网络技术,它的出现对分布式计算以及整个因特网来说,都是一场巨大的革新,从P2P网络诞生之日起,关于它的研究和应用就成为热点。它最大的特点是网络结构的疏松性,即节点的加入和离开都是十分自由的,尤其是非结构化P2P网络,所有的节点完全是动态不受约束的。因此,对P2P网络中节点的精确定位以及资源的高效搜索成为P2P网络的关键技术。 现有P2P的组织结构按搜索机制主要分为三类: (1)集中索引式的,如Napster。其中心服务器会成为整个网络的瓶颈。 (2)请求泛洪式的,属于分散式、非结构化的模型,如Gnutella。泛洪式搜索算法会产生大量的冗余查询包,成为网络的瓶颈而限制网络的性能。 (3)分布式哈希表(DHT,Distributed Hash Table),属于分散式,结构化的模型,如CAN、Chord、Pastry等。检索时必须知道目标对象的唯一标识,不支持基于多标签的信息检索。 对于非结构化P2P网络,常用的泛洪式的搜索算法编码简单,易于实现。但查询效率低下,而且会产生大量的冗余查询包,造成网络拥塞而限制网络的性能。一些新的算法对其进行了改进,减少了资源搜索过程中的盲目性,但仍存在一些缺陷,如没有考虑到目标节点资源的匹配度等关键因素,导致搜索过程过于繁琐。 针对以上问题,本文提出了一种基于标签匹配的搜索算法。该算法充分考虑节点的动态性,引入超级节点进行动态管理,节点信息动态匹配,保证了资源的有效性。 2 算法实现策略 在每个节点加入P2P网络时,都会被分配一个ID作为唯一标识。在一定范围的物理区域内,会根据节点的吞吐能力以及稳定性推举出一个超级节点,超级节点中除了存储本地的相关资源外,还会创建一个查询表,存储所管辖区域内各节点所包含资源所对应的ID及多重标签。每个区域中还需要选举出一个备用超级节点,当超级节点突然退出或崩溃时,可以充当超级节点。 当一个节点需要下载某类型的资源时,将请求表示为多关键字向量并发送到超级节点,超级节点会将其与已存的各节点的标签进行比较,选出符合条件的资源进行评分排序,并返回给申请资源的节点,节点选出想要连接的资源,搜索其节点ID,找到相应的目的节点,建立连接,实现资源的下载。若在同一个超级节点下无法找到标签一致的节点,则超级节点会向邻近的超级节点发送搜索信息进行搜索,一旦匹配,就会建立连接并进行资源传输。 在网络创建初期,由于节点之间并不熟悉,资源的来源无法预测,利用超级节点进行辅助搜索。随着网络的成熟,节点间的交流增多,某些节点之间形成固定的信息互发,给节点间互发信息次数设定一个阈值,当达到这个阈值后,两个节点互相将对方加入朋友列表,直接进行信息交流。这样节点就可以不必通过超级节点的中转而直接进行信息交流,减少因为超级节点的转发而造成的损耗。 为了方便资源搜索,网络中的每一个节点都需要维护三张数据表: (1)本地资源表,用来维护本地的资源信息,方便其它节点进行资源请求; (2)历史记录表,记录一段时间内该节点查询过的资源信息,该表中包括的资源信息主要分为查找成功的资源和查找不成功的资源两种。对于查找成功的资源则保存获取该资源的地址,而对于查找不成功的资源则需要保存该资源被请求过的次数,并且为每一条记录保存相应的更新时间戳,当表内空间不足时,按照时间戳将存放时间最长的数据置换出去。该表主要用于流行资源的快捷查询; (3)朋友节点信息表,存放朋友节点信息。 2.1 超级节点的选择算法 P2P网络中的超级节点主要实现以下几点功能: (1)处理来自其管辖区域子节点和自身的查询信息; (2)转发并处理来自其他超级节点的查询信息。 因此,如何选择那些在线时间长并且吞吐能力强的节点作为超级节点是问题的关键。 本文定义了两个变量来衡量一个节点是否适合成为超级节点:Stability和Capacity。Stability代表了节点的稳定性,Capacity代表了节点的吞吐能力。综合以上两点,算法周期性地对节点i进行评分: Score[i] m×Stability[i]+n×Capacity[i] (m+n 1) 关于选举的时机:虽然时间越短越准确,但是会导致通信量越大。因此,采用事件驱动的策略,即节点的加入、超级节点的离开等触发选举。
您可能关注的文档
最近下载
- 政论型电视专题政论片.ppt VIP
- 新版GCP临床试验伦理规范培训考试题一套 .pdf VIP
- 新编高等数学(理工类)第一章 极限与连续.ppt VIP
- 13J104 蒸压加气混凝土砌块、板材构造(OCR).pdf VIP
- 2024版思想道德与法治专题1担当复兴大任成就时代新人.pptx VIP
- 章绍同《鼓浪屿狂想曲》.pdf VIP
- UG机械设计实例教程 第2章 曲柄滑块机构建模与运动仿真.ppt VIP
- 2025年最新人教版小学二年级数学上册教学计划及进度表(新课标,新教材).docx
- 2024-2025学年小学道德与法治统编版(2024)三年级上册教学设计合集.docx
- 河道整治及生态修复工程监理细则(88页)_最新版.pdf VIP
文档评论(0)