基于对等结构的广域网分布式存储系统研究.doc

基于对等结构的广域网分布式存储系统研究.doc

  1. 1、本文档共100页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于对等结构的广域网分布式存储系统研究

基于对等结构的广域网分布式存储系统研究 (申请清华大学工学博士学位论文) 培养单位:计算机科学与技术系 学科: 计算机科学与技术 研究生: 胡 进 锋 指导教师:郑 纬 民 教 授 二○○五年四月 I 摘 要 近年来,基于对等结构(Peer-to-Peer,简写为“P2P”)的大规模分布式系 统迅速发展起来,成为占用Internet 带宽最多的网络应用。本文的研究对象是对 等结构的广域网分布式存储系统,它力图帮助用户在广域网范围内分布数据以 提高数据的可靠性、可用性和访问性能。而P2P 系统具有的大规模、高动态性、 高异构性、强异步性等新特点为系统设计增加了难度。本文对广域网分布式存 储系统所涉及到的多个方面进行了细致充分的研究,提出了新颖有效的实用算 法。本文的主要贡献包括: (1)提出了大规模P2P 系统中结点信息收集算法PeerWindow,解决了已 有算法不支持异构性的问题,使得P2P 系统的结点可以根据各自能力决定结点 信息收集量,同时,该算法具有很高的收集效率,结点每付出1kbps 的带宽就可 以收集到上千个其它结点的信息。 (2)提出了异构环境下基于前串匹配的应用层组播算法,实现了异构系统 中无冗余的组播算法,保证消息组播到所有相关结点,并且每个消息每个结点 只收到一次。通过理论分析可以证明该算法具有完整性,且组播过程无冗余。 实验数据验证了算法的正确性并显示算法具有很高的组播效率。 (3)提出了结构化覆盖网路由协议Tourist,解决了已有算法不具有自适应 性的问题。Tourist 充分利用了P2P 系统中所有结点的可用带宽资源,在给定的 系统环境下自动优化,取得最佳路由效率。同时,Tourist 具有路由高效性,在 500 万结点的超大规模P2P 系统中,所有消息路由都可以在两跳之内完成。 (4)提出了P2P 环境中的索引管理算法PB-link Tree,解决了已有算法在 执行联合查询时带宽消耗过大的问题。PB-link Tree 通过哈希定位将B+树分布到 多个结点上,使得联合查询的执行过程中不需要进行中间结果的大规模传输。 实验表明,PB-link Tree 较之传统的分布式索引管理算法DB-link Tree 在查询过 程中数据传输量更小,查询时间更短。 (5)提出并实现了广域网分布式存储系统Granary,该系统利用本文的研 究成果进行面向对象的数据存储和管理,支持基于属性的数据查询,具有更好 的数据访问模式和更强的查询处理能力,方便上层应用的快速开发。 关键词: 对等系统 分布式存储系统 结构化覆盖网 面向对象存储 Abstract II Abstract Peer-to-Peer systems (abbreviated to “P2P systems”) have being experiencing a rapid growth in the past several years. Currently, it has become the one that occupies the most amount of Internet bandwidth among all the network applications. In this dissertation, we focus on P2P storage systems, which are deployed in the wide-area network and intend to help users scatter their files on other peers’ storage devices to improve data’s availability, reliability and access efficiency. Designing such a system must face the new properties of P2P systems which did not appear in traditional cluster-scale or LAN-scale systems, i.e, large amount of nodes, high dynamic, high heterogeneity, high asynchrony, etc. We propose several novel and practical agrithms that address problems in various aspects of P2P storage systems. Main contribution of this dissertation is as follows. (1) A node c

文档评论(0)

xy88118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档