Erasure code在分布式存储系统中的研究.ppt

Erasure code在分布式存储系统中的研究.ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Erasure code在分布式存储系统中的研究

文件合并实现 文件合并实现 达到了: 数据的分布式 冗余存储! 遇到的问题 文件末补“0”,去“0” 如何操作文件 .txt文件的普及 如何获取对应数据分块所在的数据碎片 内存文件映射技术 Windows的一种内存管理方法 直接对被映射的文件进行访问,而不必执行文件I/O操作,无需对文件内容进行缓冲处理 适合处理大文件 内存文件映射技术 性能分析 性能测试 测试平台为Visual Studio 2008,奔腾2.8G cpu,内存 480M,取当数据块数n=5,校验块数m=3,w=8时: 操作 100K(ms) 500K(ms) 1M(ms) 10M(ms) 50M(ms) 100M(ms) 250M(ms) 分割时间 20 71 153 1540 5341 10000 30325 合并时间 22 82 179 1892 6637 13540 33612 分割时间/文件大小(ms/k) 0.2 0.142 0.149 0.15 0.104 0.098 0.118 合并时间/文件大小(ms/k) 0.22 0.164 0.175 0.185 0.13 0.132 0.131 t分割≈t合并, t合并略大 t分割(t合并)/文件大小微呈减小趋势变化,但比例一定 同样大小不同类型文件分割合并耗时存在一定差别 性能分析 数据可用性分析 例:存储系统中由1 000 000个结点组成,其 中10%的结点不可用 传 统 复 制 算 法:存储数据D的2个副本 — 0.99 编 码 率 为 0.5 的 基 于erasure code 的 复 制 算 法:对D的32个数据块进行编码 —0.999999998 基于Erasure code的高可用 分布式存储体系 系 统 接 口 文件 编码 解码 模块 分块 分发 获取 模块 动态 维护 模块 其他 功能 模块 Chord 分布式存储技术的其他应用 基于peer-to-peer计算模型的海量分布式文件系统 (1)存储体系结构问题 (2)Peer-to-Peer路由算法 (3)分布式索引、检索问题 (4)资源访问效率问题 (5)分布式安全体系问题 云计算(Cloud Computing) * What is Cloud Computing? ⊕Grid Computing ⊕Computing as Utility ⊕Web Services in the cloud ⊕SAAS (Software as a service) ⊕PAAS (Platform as a service) *CC = SAAS + PAAS + Data + Infrastructure *A simple example : 分布式邮件系统 *The value ⊕transparently make software and data available everywhere ⊕promotes “Computing as Utility” “Data Intensive Business” ⊕profound impacts on economic 赋予互联网更大的内涵,并改变互联网企业的运营模式。 扩大软硬件应用外延,并改变软硬件产品的应用模式。 底层的infrastructure: 分布式 存储和计算! 搜索是开启云计算的一把钥匙。 because of search , we research cloud computing ; because of cloud computing , we can search everything available and easily. Erasure code在分布式 存储系统中的研究 学 院: 计算机科学与技术学院 专 业: 计算机科学与技术 学 号: 08S003045 姓 名: 王佳 导 师: 余翔湛 副教授 主要内容 ·研究背景及研究意义 ·研究内容 ·设计与实现 ·关键技术分析 ·分布式存储技术的应用 研究背景及研究意义 灾难—数据损失—公司瘫痪— 容灾! 容灾有效有意义— 数据本地化存储的局限性— 分布式存储!! 研究背景及研究意义 较高的数据持续性和可靠性— 冗余容错!! 冗余容错 ·完全数据复制 ·RAID 目的意义 研究内容 Erasure code理论基本思想 基于Vandermonde矩阵的RS算法 有限域理论 内存文件映射技术 分布式存储

文档评论(0)

yurixiang1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档