大规模网络中BitTorrent流行为分析.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大规模网络中BitTorrent 流行为分析 1,2 1,2 陈亮 龚俭 1 (东南大学计算机学院,江苏 南京 210096) 2 (江苏省计算机网络技术重点实验室,江苏 南京 210096) 摘 要:针对Peer-to-Peer(P2P)应用流量已成为 Internet 带宽的最大占用者的现状,本文在使用特征串 方法准确采集国内最流行的P2P 应用——BitTorrent 应用流量的基础上,深入研究了 BitTorrent 应用的 流长、流持续时间、流速以及结点传输的流量、连接数等测度的分布情况,指出其流长、持续时间均服从 We ibull 分布,流速较一般TCP 流速慢,并且BitTorrent 网络呈现很强的不平衡性,同时分析了各分布中 的异常情况。 关键词:大规 网络;P2P;BitTorrent;流行为;测度 中图分类号 TP393 文献标识码 A 1 引言 在过去的几年中,Peer-to-Peer (P2P )应用的发展十分迅速。P2P 流量早已超过Web 服务的流量,成 为Internet 上最大的带宽占用者[1]。P2P 模型异于传统C/S 架构模型的特点必然使得其流量特征与传统应用 层协议的流量特征不同,这些不同导致当前 Internet 流量特征较过去有很大的变化。因此,深入分析 P2P 流量特征对分析Internet 总体流量特征、进行流量规划以及区分服务都有着重要的意义。 早期的P2P 流量行为分析主要针对于每个端用户的行为特征[2][3],例如共享的文件数 在线时间和 传输的数据量,以及底层网络的一些特征如延迟等。这些研究均关注于用户在P2P 网络中表现的行为,没 有针对P2P 系统在传输文件时的流特征(如流长 流速等)进行探讨。在2004 年PAM 会议上,Kurt Tutschku 使用被动测量的方法对eDonkey 应用协议的流量特征进行了较详细的分析[4] ,以统计的方法给出了流长 流到达间隔等测度以及用户地域的分布,但是其只给出了测度分布的曲线,既没有得出曲线的分布函数, 也没有对其进行任何讨论。同年的PAM 会议上,M. Izal 等人使用主动测量的方法研究了BitTorrent 协议的 流量行为[5],但是其给出的测度大多为均值,且没有进行深入的分析。2005 年,L. Plissonneau 等人在前人 的基础上全面分析了四种P2P 协议的行为特征[1],使用统计的方法得出了传输数据量 持续时间等的分布 函数,并给出了流结束方式、结点地域分布、主机连接数等的统计分布。但是 研究仍存在两个缺陷:一 是其在给出测度的分布函数时过于粗糙,并没有给出分布的参数以及任何数学证明;二是虽然其讨论了测 度的分布情况,但并没有对产生该情况的原因做进一步的分析。本文将在这些方面做更深入的研究。另一 方面,国内做P2P 行为特征的研究尚未成为热点,据作者了解,国内只有文献[6]对P2P 流量行为进行了八 点分析,但是除了流的长相关性分析以外,对其它的特征都只给出了统计数值,没有进行深入分析。 本文针对国内的特点,选取国内使用量最大的P2P 应用——BitTorrent 协议[7] (下简称BT )作为代表, 深入研究了其流长 持续时间 流速、主机连接数 传输数据量等流量特征。与前期研究相比,本研究在 以下几个方面有所不同:1 前期所有使用被动测量获得P2P 流量的研究均是基于端口区分P2P 流量和其 它流量,而大多数P2P 应用为了避免识别,均使用随机端口进行通信[8],这就造成样本数据的不可信,从 而导致分析结果的不可信。而本文采用基于内容检查的方法识别BT 流量,样本完全可信。2 本文是对前 期研究的深入,在得到流长 持续时间等测度的累积分布曲线基础上,进一步分析得到这些测度的分布函 数,并使用Kolmogorov 检验函数的合理性。3 本文在讨论测度分布的基础上,更进一步的分析产生这些 Supported by the National Grand Fundamental Research 973 Program Foundation of China under Grant No. 2003CB314804, 国家重点 基础研究发展

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档