P2P文件共享系统的测量与研究.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
P2P文件共享系统的测量与研究 韩士雄 han8048347@163.com 华北计算技术研究所 什么是P2P网络? 争议 没有特定的集中的网络设备 由网络中的结点提供资源或服务 所有结点(设备)的角色、责任和义务平等 研究动机 P2P文件共享系统(Gnutella and Napster)已得到广泛应用 还没有人对P2P网络进行测量研究 发现系统中用户的特征:带宽瓶颈、包延迟、用户接入与退出系统的生命周期、用户共享和下载的数据量、用户间的协作水平,特征之间的关系 内容概要 文章概述 研究方法 测量结果 建议 结论 介绍 Gnutella Napster 节点对系统产生的影响 例:网络状况差(大量引用) 接入时间短(资源可用性) 。。。 研究方法 主动测量 第一步:周期性获取每个系统的同时在线人数以及用户的状态,包括IP地址、端口号以及客户端软件自己上报的一些信息。 第二步:针对第一步得到的用户,进行长时间探测,获取他们的相应信息,如带宽瓶颈等。 研究方法—体系结构 目标:利用互联网使用户自由交换文件 协议:HTTP 用户:对等(均衡)、上传、下载(与分布式系统差异) 策略:定位文件 研究方法—体系结构 研究方法—Napster网络爬虫 无法直接访问Napster服务器 提前确定文件列表(流行音乐)--误差 并行发出大量请求 收集用户信息:带宽、共享文件数、正在上传及下载的文件数、文件的名字及大小、IP地址 统计:160服务器,40%-60%用户 80%-95%文件 546401个不同IP地址,509538个用户 研究方法—Gnutella网络爬虫 连接热点Peer 循环发送ping消息(TTL很大) 通过pong消息获取用户信息(IP地址等) 每个网络爬虫运行2分钟,无误差 统计:每个网络爬虫获取到8000-10000个结点信息,总节点的25%-50% 1180205个不同IP,1239487个用户 研究方法—Gnutella网络爬虫 研究方法—测量用户特征 带宽瓶颈测量 延迟测量 生命周期测量(连接频率、保持连接时间) 研究方法—带宽瓶颈测量 Napster(25%)和Gnutella都存在不上报带宽的节点 采用动态侦听获取节点带宽,两个难点: 1、可用带宽随时间变化 2、必须衡量丢包率 高带宽接入(1G) 可用带宽=链路带宽=最后一跳 工具:SProbe(TCP包) 研究方法—生命期测量 Peer的三种状态: 离线状态(未接入互联网或不响应TCP SYN包) 非活动状态(接入互联网,响应TCP SYN包,但未接入点对点系统) 活动状态(已接入点对点系统,能接受TCP连接) 工具:LF(可监视上万个结点生命期) 研究方法—测量对象描述 Gnutella 1、生命期(17125Peer,60小时,7分钟) 2、瓶颈带宽(595974Peer,下行223552, 上行16252) 3、延迟(339502Peer) Napster 1、生命期(7000Peer,25小时,2分钟) 2、瓶颈带宽(2049/4079Peer) 测量结果—带宽瓶颈 测量结果--带宽瓶颈 测量结果—Napster结点带宽 测量结果—Napster结点带宽 测量结果—Gnutella延迟 测量结果—Gnutella延迟 测量结果—可用性 测量结果—可用性 测量结果—文件共享数量 测量结果—文件共享数量 测量结果—下载、上传、共享文件 测量结果—共享文件特征 测量结果—Gnutella网络拓扑 对Peer-to-Peer系统的建议 根据结点的物理特征及可靠性来分配责任 节点之间的差异: 连接速度、延迟、生命期、共享数据 3-5个数量级 直接测量各节点的物理特征 处理服务器与客户端的关系 Gnutella 26%的用户不共享数据 Napster 20%-40%的用户不共享或很少共享 总结 Gnutella和Napster内部节点之间存在着较大的差异 系统中存在着责任不均衡的问题 用户会在某种动机的驱使下谎报自己的信息 Thank you! * * 例:电驴、BT下载、搜狗音乐等 P P P P P P S S S S Q R D P P P P P P Q R P Q Q Napster Gnutella 下行带宽高于上行带宽 下行带宽Gnutella高于Napster 70ms 280ms 接入方式影响上网带宽及延迟大小 Gnutella与Napster的文件传输方式基本相同 少量的用户拥有大部分的资源 文件共享数量Gnutella高于Napster 上传文件(高带宽用户) 下载文件(低带宽用户) Gnutella共享文件 数量远大于Napster Gnutella依赖少

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档