- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
P2P 普及基础知识
关键词:P2P, 互联网,网络通信,
摘要:本文分八个方面介绍 P2P 的基础知识: 拓扑结构与 P2P, 分布式结构, 全分布非结构
化网络, 半分布式结构, P2P 计算的标准化工作, 对各种P2P 算法的探讨, DHT 算法的研究
和研究Internet 拓扑的意义.
P2P 普及系列之一:拓扑结构与P2P
拓扑结构是指分布式系统中各个计算单元之间的物理或逻辑的互联关系,结点之间的拓扑结
构一直是确定系统类型的重要依据。目前互联网络中广泛使用集中式、层次式等拓扑结构,
Interne 本身是世界上最大的非集中式的互联网络,但是九十年代所建立的一些网络应用系
统却是完全的集中式的系统、很多Web 应用都是运行在集中式的服务器系统上。集中式拓
扑结构系统目前面临着过量存储负载、Dos 攻击等一些难以解决的问题。
P2P 系统一般要构造一个非集中式的拓扑结构,在构造过程中需要解决系统中所包含的大
量结点如何命名、组织以及确定结点的加入/离开方式、出错恢复等问题。
根据拓扑结构的关系可以将P2P 研究分为4 种形式:中心化拓扑(Centralized Topolo
gy );全分布式非结构化拓扑(Decentralized Unstructured Topology);全分布式结构化
拓扑(Decentralized Structured Topology,也称作DHT 网络)和半分布式拓扑(Partiall
y Decentralized Topology )。
其中,中心化拓扑最大的优点是维护简单发现效率高。由于资源的发现依赖中心化的目
录系统,发现算法灵活高效并能够实现复杂查询。最大的问题与传统客户机/服务器结构类
似,容易造成单点故障,访问的“热点”现象和法律等相关问题,这是第一代P2P 网络采用
的结构模式,经典案例就是著名的MP3 共享软件Napster。
Napster 是最早出现的P2P 系统之一,并在短期内迅速成长起来。Napster 实质上并非
是纯粹的P2P 系统,它通过一个中央服务器保存所有Napster 用户上传的音乐文件索引和
存放位置的信息。当某个用户需要某个音乐文件时,首先连接到Napster 服务器,在服务器
进行检索,并由服务器返回存有该文件的用户信息;再由请求者直接连到文件的所有者传输
文件。
Napster 首先实现了文件查询与文件传输的分离,有效地节省了中央服务器的带宽消耗,
减少了系统的文件传输延时。这种方式最大的隐患在中央服务器上,如果该服务器失效,整
个系统都会瘫痪。当用户数量增加到105 或者更高时,Napster 的系统性能会大大下降。另
一个问题在于安全性上,Napster 并没有提供有效的安全机制。
在Napster 模型中,一群高性能的中央服务器保存着网络中所有活动对等计算机共享资
源的目录信息。当需要查询某个文件时,对等机会向一台中央服务器发出文件查询请求。中
央服务器进行相应的检索和查询后,会返回符合查询要求的对等机地址信息列表。查询发起
对等机接收到应答后,会根据网络流量和延迟等信息进行选择,和合适的对等机建立连接,
并开始文件传输。
这种对等网络模型存在很多问题,主要表现为:
(1) 中央服务器的瘫痪容易导致整个网络的崩馈,可靠性和安全性较低。
(2)随着网络规模的扩大,对中央索引服务器进行维护和更新的费用将急剧增加,所需成
本过高。
(3) 中央服务器的存在引起共享资源在版权问题上的纠纷,并因此被攻击为非纯粹意义上
的P2P 网络模型。对小型网络而言,集中目录式模型在管理和控制方面占一定优势。但鉴
于其存在的种种缺陷,该模型并不适合大型网络应用。
P2P 普及系列之二:分布式结构
Pastry 是微软研究院提出的可扩展的分布式对象定位和路由协议,可用于构建大规模的P2P
系统。在Pastry 中,每个结点分配一个128 位的结点标识符号(nodeID) ,所有的结点标识
符形成了一个环形的nodeID 空间,范围从0 到2128 - 1 ,结点加入系统时通过散列结点
IP 地址在128 位nodeID 空间中随机分配。
在MIT,开展了多个与P2P 相关的研究项目:Chord,GRID 和RON。Chord 项目的目标
是提供一个适合于P2P 环境的分布式资源发现服务,它通过使用DHT 技术使得发现指定对
象只需要维护O(logN)长度的路由表。
在DHT 技术中,网络结点按照一定的方式分配一个唯一结点标识符(N
文档评论(0)