分布式存储与文件共享研究.pptVIP

下载本文档

7
0
约2.81千字
约 22页
2017-08-08 发布于安徽
举报
版权申诉

分布式存储与文件共享研究.ppt

1、本文档共22页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

分布式存储和文件共享研究 Zheng_shengwei Computer science of Peking university 全球规模分布式存储的基本问题数据在那里存放？－位置的无关性数据的保密性－私人数据的加密性，访问的授权。数据的容错性－数据的冗余，数据的重新分布数据的维护：难要求：自动的优化，诊断错误和自动的修复提出的数据维护机制数据维护方式：－存储级别的维护与数据的语义无关（文章的主要方法）－信息级别的维护基于数据的语义，如数据的索引，分类等存储级别的维护采用的机制：－自我组织的路由管理－m-of-n编码方式和修复－拜占庭的更新和内在的复制管理上述机制组成了一个高度可行的自我维护数据存储管理：－在服务器崩溃或者网络错误的时候自我的恢复－自动的允许新的资源加入－自动调节访问模式系统的数据结构－数据片断分布式存储通过Erasure code来保证使得每个数据片断都有一个全球唯一的标志GUID －查找数据片断由Tapestry来保证（路由）把Guid准确的映射到服务器的地址－数据版本的控制由于数据地只读性，则每更新一次就产生一个新的数据版本 Active Guid 系统的数据结构－Inner ring 映射Active Guid－最近访问的历史版本提高了容错性同时也提供了：数据的一致性，数据的合法作者，更新序列维护着数据的更新历史记录－数据复制的管理通过Tapestry来告知其他的服务器自我组织的路由管理每个节点角色：－服务器－客户端－两者都是有一个唯一标志的NodeID 此ID和位置和语义都无关路由管理：Tapestry 保持多个最近的邻接点的指针(冗余）自我组织的路由管理路由策略：－在一个节点产生一个新的备份的时候，Tapesrty会存储一个从根节点到此节点的指针－通过Tapestry查找一个数据的根节点时候，遇到一个有此备份的节点就返回－－Tapestry通过向节点的邻接点来扩散路由消息－结果Tapestry保持三个最少延迟的指针自我组织的路由管理 Tapestry 例：源节点0325 目标节点4598 一可能路径穿过的节点：－***8-**98-*598-4598 自我组织的路由管理实践结构：－5000节点的拓扑结构－4096节点参与Tapestry路由管理－任意从一个节点向256各目标节点发送包同时Tapestry间隔使用UDP探测包来衡量连接状况，并且能够在检测到路由错误的时候马上利用冗余指针来继续路由自我组织的路由管理其中B和E区是 Tapestry路由机制错误的的区域自我组织的路由管理－节点的加入产生一个随机的NodeID标志自己通过LDAP服务器来得到邻接点，然后通过邻接点来路由新节点消息，最终结果是新节点产生一个完全的路由表。－节点的退出 1.由邻接点检测到节点的退出，更新路由表 2.通过存储地冗余指针来告知其他节点 M-of-N编码和修复 M-of-n编码－erasure code把输入的一个数据目标的一系列M片断转换成N片断，NM,复制的分布在各个节点，任何M个片断都可以重新准确的重构成原来的数据。－分块存储的时候维护一张erasure code表，维护每一块的信息，同时由inner ring维护块的更新信息。－系统自动根据M的调节N保持冗余信息，保持数据的高容错性。 M-of-N编码和修复修复－错误的预测在预测错误要发生前，将数据移动到别的盘－本地扫描节点根据本地存储的数据的内容用Hash检测是否和节点的Guid符合。－分布式检测和修复由Tapestry检测是否低于一定冗余，保证有足够的冗余来使得数据能够自动恢复－全局扫描拜占庭更新－更新通过inner ring来维护更新时候产生的新的版本，同时维护更新的历史记录点对点文件共享系统 --目前的点对点文件共享系统问题大多数没有考虑节点的本身特征如带宽,瓶颈， IP层的发包延迟等问题因为获得接点这些特征的情况下，可以考虑任务的分布，避免把经常访问的资源放在这些节点上点对点文件共享系统 --针对NAPSTER和GNUTELLA两个系统的研究分析方法： 1。通过CRAWL得到节点资源的快照如地址，端口，软件资源等 2。然后探测服务器的各种特征如瓶颈，带宽等特征点对点文