Researches on Distributed Storage.pptVIP

下载本文档

2
0
约7千字
约 24页
2016-04-11 发布于安徽
举报
版权申诉

Researches on Distributed Storage.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

Researches on Distributed Storage.ppt

Researches on Distributed Storage 计算机学院张一鸣 2006.10 主要内容 (NSDI, OSDI, and SOSP) §1 可靠性 §2 缓存 §3 P2P存储 §4 其他 §1 可靠性 Glacier: Highly durable, decentralized storage despite massive correlated failures (nsdi 05, Rice) Availability of Multi-Object Operations (nsdi06, CMU, Best Paper) Subtleties in Tolerating Correlated Failures in Wide-area Storage Systems (nsdi06, CMU) 1. Glacier: Highly durable, decentralized storage despite massive correlated failures (nsdi 05, Rice) Question：目前的系统或者假设节点失效是独立的，或者依靠introspection（内省）把redundant数据放置在低失效相关的节点上。不幸的是，节点失效不是独立的，而且构建一个大规模系统的准确的失效模型非常困难。同时，Internet上的恶意病毒也很有可能造成非独立的节点失效。 Glacier：一个分布式存储系统，依靠大量的冗余来对抗大规模的相关失效。在空间和时间上最小化冗余的开销： Erasure coding和garbage collection减小了存储开销; 小对象聚合和松耦合的redundant片段的维护协议减小了消息开销. 2. Availability of Multi-Object Operations (nsdi06, CMU, Best Paper) Question：现有的分布式存储系统通常注意了单独的数据对象的availability，然而事实上用户级任务通常需要访问多个对象。现有分布式存储系统assign replicas的方式是不同的：随机assign replicas到各节点（RAND）人工把对象划分不同的set并把每个set映射到多个节点（PTN） Assign replicas到DHT环上的连续多个节点上述方式中，在单独对象的availability相同的情况下，多对象availability可能相差很大。 2. Availability of Multi-Object Operations (nsdi06, CMU, Best Paper) 多对象操作可以分为两类： Strict操作，不能容忍任何对象的缺失 Tolerant操作：非strict的操作分析表明：对strict操作，PTN最好对tolerant操作，RAND最好没有一种方式能够achieve the best of both PTN and RAND 我们进一步的模拟表明，虽然操作对对象的缺失有多种容忍级别，但是只有两种级别在选择一种assignment的时候起作用：操作是否需要所有对象（strict，loose）? 因此，对所有loose操作，RAND最好；对strict操作，PTN最好；其他方式在RAND和PTN之间。 3. Subtleties in Tolerating Correlated Failures in Wide-area Storage Systems (nsdi06, CMU) Question：节点失效通常是相关的，其原因包括system software bugs, DDoS attacks, virus/worm infections, node overload, and human errors。通过多个现实中的failure traces，我们定性的回答了4个关于怎样设计tolerating correlated failures系统的重要的问题。相关失效能否使用历史纪录进行模式预测? 答案：几乎不能。仅使用失效规模进行建模是否足够? 答案：否。。使用更多的 fragments/replicas 对提高 availability是否总是有效? 答案：有效性越来越小。独立失效下好的设计在相关失效下一定好吗? 答案：否。 §2 缓存 Shark: Scaling File Servers via Cooperative Caching (nsdi 05，New York) Program-Counter-Based Pattern Classification in Buffer Caching (osdi04