- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
P2P网中基于文件分片副本建立策略
P2P网中基于文件分片副本建立策略
摘要:在大规模P2P网络中,为了提高数据的可用性,可以通过在系统中多个节点上建立数据副本的方法来增加数据的冗余度。为了减小副本建立的开销,可采用一种基于文件分片的副本建立策略,将需要复制的数据文件先进行分片,然后把这些分片在一组选取好的候选节点间进行分发复制。该方法能够充分利用网络带宽,明显减小建立副本所需的时间开销。??
关键词:对等网; 副本; 文件分片
中图分类号:TP393文献标志码:A
文章编号:1001-3695(2008)01-0171-03
0引言??
随着计算机技术的发展,C/S模型已不能满足需求。其单点故障和热点问题已经变得越来越不可接受。近年来,P2P网络模型由于其结构灵活、能够充分利用网络的边缘资源、具有良好的扩展性等特点得到了迅速发展。其主要应用领域包括文件共享、分布式存储、协同工作等。其中又以文件共享系统为最典型的代表,如BitTorrent和Gnutella[1]等。在P2P系统中,节点具有自组织、自适应性,每个节点都与系统中的其他节点相连接。P2P系统具有以下特点[2]:系统中任意两个节点可以通信;任何一个节点都可以自由地、动态地加入或者离开;节点之间完全平等;节点相互共享某些资源。P2P系统中的每个节点拥有一个共享的数据集为系统中的其他节点服务。这些共享的数据集通常是以文件的形式存在。由于P2P系统中的节点具有自治性,可以随时加入或者离开。当某个节点离开后,该节点上的共享数据集也会不可用。为了提高节点上这些共享数据集的可用性和访问效率,可以主动在系统中复制多个数据副本,增加数据的冗余度。??
传统复制过程中,数据资源通常是以完整的数据文件为单位在节点间进行拷贝,其研究重点在于副本数目的设置、副本的数据一致性维护等;而对大规模副本复制时会引起大量的时间开销、带宽开销且对负载均衡问题考虑得较少。本文提出一种基于文件分片的副本建立策略,借鉴现有的P2P文件共享系统中文件分片下载的思想,将需要复制的数据文件先进行分片,然后把这些分片在一组事先选取用来放置数据副本的候选节点间进行分发复制。当候选节点得到所有的分片后即完成了复制过程。此方法实现简单,充分利用网络带宽,用较小的代价提供了较好的性能,并使参与复制的候选节点间负载均衡。??
1P2P系统中的复制技术??
复制(replication)是通过创建同一个数据文件的多个拷贝来提高数据资源的可用性并且提高整个P2P网络的有效性和数据资源的使用效率。具体而言,采用数据复制技术可以达到如下目的[3]:??
a)负载均衡。在用户和数据资源广泛分布、数据资源访问频繁的P2P网络中,如果数据资源只有一个副本,很容易造成性能瓶颈,出现负载过重的情况,而数据复制可以解决这样的问题。??
b)降低访问延迟。数据资源被复制到多个存储节点之后,用户可以选取最近的副本进行访问,从而降低访问延迟。??
c)提高可用性。如果数据资源只有一个副本,容易出现单点失效现象,使数据服务的可用性降低;采用数据复制技术可以避免上述情况,从而提高数据服务的可用性。??
d)节省网络带宽。数据被复制到本地或者较近的节点后,用户不需要每次都远程地访问和传输数据资源,从而节省了网络带宽,尤其是宝贵的广域网带宽。??
复制技术在P2P系统中有着广泛的应用和重要的位置。常用的复制技术包括所有者复制、路径复制和随机复制。在Gnutella中使用了所有者复制技术, 即请求数据的节点在本地创建该数据的一个副本。随机复制是一种常用复制方法。当需要复制时,随机均匀地选择若干节点,在这些节点上创建文件的副本。传统的复制过程中,数据资源通常是以完整的数据文件为单位在节点间进行拷贝。以随机复制(图1)为例,实现把文件F的n个副本分发到复制节点集的n个节点上(每个节点上放置一个副本)。复制是通过n个并发的与这n个节点相连的网络连接来传输文件F。这种方法带宽利用率较低,常常会因为复制发起节点的带宽限制,使得整个复制过程时间开销较大。通过采用优化的复制策略,选择一组适当的节点来放置副本,并采用基于文件分片的副本建立策略,可以有效地提高复制效率、减小开销,提高数据的可用性。??
2候选节点的选取??
在P2P系统中,虽然每个节点在网络中的地位是平等的,但它们异质,每个节点的性能不相同。在P2P系统中,通过选择某些高性能的节点来放置数据副本,可以有效提高副本建立和访问时的效率,并保证在一定可用性的前提下减少所需副本的数量。这些高性能节点本文中称为候选节点。在一个P2P系统的复制模型中,候选节点应该有以下几个特点[4]:
a)候选节点能够保证稳
文档评论(0)