P2P和复杂网络在多媒体信息检索中的应用.docVIP

P2P和复杂网络在多媒体信息检索中的应用.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
P2P和复杂网络在多媒体信息检索中的应用.doc

P2P与复杂网络在多媒体信息检索中的应用 通过对P2P、复杂网络以及多媒体信息检索(以文献检索为主)三块内容进行调研,我初步对各个方向有了大致了解,对它们的交叉应用做了一定的学习研究,并产生了一些自己的想法。 下面我将分四个部分阐述。前三个部分分别总结对P2P、复杂网络以及多媒体信息检索的调研结果,第四部分阐述三者的交叉应用并做出总结。 一、P2P调研结果 P2P(Peer-to-Peer)又称对等网络,作为一种全新的网络构架,它表示“通过在系统之间直接交换信息来共享计算机资源和服务”的系统。P2P打破了传统的客户/服务器模式,对等网中各节点的地位都是相同的,每个节点既充当服务器,为其他节点提供服务,同时也充当客户机,享用其他节点提供的服务。P2P可以被广泛应用于互联网和局域网中,极大地提高网络信息、带宽和计算资源的利用率,有效均衡负载。 P2P相对于其他网络模型有很多优势。P2P架构不需要性能超强的服务器,而是将过高的成本在网络节点中分摊开来,充分聚集和利用网络中其他节点的空闲资源。也正是由于P2P网络的每个节点既可作服务器又是客户端,它还有高扩展性、稳定性和很强的容错性,在网络拓扑构造、安全与可靠性、分布式数据存储、大规模并行计算等方面都有很强的应用性,这里就不多介绍了。 现有的P2P文件共享系统按照结构特征通常被分为四类,即基于集中索引的P2P网络、非结构化P2P网络、基于分布式哈希表的结构化P2P网络和混合式P2P网络。集中索引P2P结构是最早出现的对等网络应用模式,因为仍然具有中心化的特点也被称为非纯粹的P2P结构,典型系统是Napster。非结构化的P2P网络是在网络中采用随机图的节点拓扑组织方式,克服了单点故障的问题,可扩展性更强,典型系统是Gnutella。结构化的P2P搜索机制中,P2P网络的拓扑结构是受到严格控制的,文件不是被随机摆放,而必须放置在P2P网络的特定节点上以利于搜索的进行,多采用分布式哈希表(DHT)算法。混合式P2P网络中,节点会把它上面的资源信息发布到超节点上,为查找一个文件,节点会首先把查询发到超节点上,查询也可以被进一步转发到其它的超节点上。超节点一般会具有较大的带宽和较强的处理能力。 信息检索是从大量文档信息集合中找到与给定查询请求相关的文档子集。P2P信息检索分为集中式信息检索、泛洪式信息检索和DHT式信息检索。集中式信息检索(如Napster)需要一个中央服务器保存所有注册过的文件,查询工作由服务器完成,然后各节点采用点对点方式直接通讯。缺点是单点失效,可扩展性不佳。泛洪式信息检索(如Gnutella、FreeNet)中,每个节点仅仅维护本身的内容索引,一个节点要进行检索,就像他的邻居节点广播消息(泛洪),邻居节点可满足就返回结果集,否则向该点的邻居节点转发。缺点是不能保证可靠性。DHT式信息检索利用分布式哈希表,每个节点不仅维护本身的内容缩引,而且维护其他节点上部分特定内容的索引,维护该内容的索引节点ID可通过Hash得到。缺点是不支持模糊查找。 二、复杂网络理论调研结果 社会心理学家Milgram曾做过一个实验,实验要求参与者把一封信通过熟人传送给指定的某人,借此探明熟人关系网络中路径长度的分布。虽然实验中大多数信被丢弃,但仍有四分之一的信被送达目标人。统计显示平均依次经过6个熟人就可传达到,这就是著名的“六度分隔”理论。“六度分隔”现象的普遍存在一定程度上揭示了复杂网络的内在共性——看似复杂的自然与社会网络中各元素之间的距离其实很“近”,专业术语称为“小世界效应”:即网络中任意两点间的平均距离L随网络节点数N的增加呈对数增长,网络规模的变化并不对L的值产生很大影响,网络局部呈现明显的集团化特性。 两个定义。簇系数:对于某个节点,它的簇系数被定义为它所有相邻节点之间连得数目占可能的最大连边数目的比例,专门用来衡量网络节点聚类的情况。 平均距离:在网络中,两点间的距离被定义为连接两点的最短路径所包含的边的数目,对所有节点对的距离求平均,就得到了网络的平均距离。 规则网络具有很大的簇系数和大的平均距离,随机网络具有小的簇系数和小的平均距离。1998年,Watts和Strogatz通过以某个很小的概率切断规则网络中原始的边,并随机选择新的端点重新连接,构造出了介于规则网络和随机网络的“小世界网络”,它同时具有大的簇系数和小的平均距离。也就是说,网络呈现一种以密集的局部连接为主,以稀少的长程连接为辅的体系结构。举个例子,在社会网中,人们通常有一些与其兴趣相似的朋友,同时也可能有少数与其兴趣不一定相似但有众多社会联系的朋友,从而人们可以通过很短的“朋友的朋友”社会关系链相互联

文档评论(0)

smdh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档