- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
存储系统重构优化技术研究
摘 要:目前海量存储系统规模逐渐增长,存储节点失效是普遍现象。因此存储系统的重构优化问题越来越受到研究人员的关注。综述了存储系统从数据布局和数据调度两个层面的重构技术研究进展和现状,同时对各种典型重构技术从原理、实现机制等方面进行了分析和归纳,并对比分析和总结了各种重构技术的适应场景。结合海量存储系统负载特征的复杂性和应用环境的复杂性等特点,指出了存储系统重构技术的未来研究方向。
关键词:纠删编码存储系统;重构技术;存储可靠性;数据可用性
中图分类号:TP311 文献标识码:A 文章编号:2095-1302(2017)05-0-04
0 引 言
当今社会正处于数据爆炸式增长的时代,网络技术提供商Cisco预测,从2013到2018年全球每个月的网络数据量将以21%的年增长速度上升,每月的网络数据量将从2013年的51 EB增长到2018年的132 EB,数据量几乎增长了3倍,并且到2016年,每个月的网络数据量已达91 EB[1]。企业数据中心面临海量数据存储的需求,因此数据中心需要廉价、可靠、高性能和高能效的数据存储系统。
现代存储系统采用一定的容错策略,通过重构技术确保存储的可靠性和数据可用性。一方面当一定存储节点失效时,通过重构技术可以恢复失效节点以确保存储可靠,另一方面考虑网络I/O负载的复杂性特征,为及时响应用户的数据访问请求,通过重构技术以确保数据的高效可用。重构技术是根据存储系统容错数据布局方案,采用一定I/O优化调度策略,以减少I/O开销与降低CPU计算开销为手段,实现可靠并快速获取用户数据为目的的优化过程。
1 纠删编码存储系统重构优化技术
图1所示为典型纠删编码存储系统的重构优化过程。在纠删编码存储系统中,将k个保存原始数据的磁盘经过编码计算操作,得到m个冗余磁盘;当存储系统中有不超过m个磁盘失效时,根据纠删编码的编码/解码计算规则,通过存活的数据磁盘和冗余磁盘恢复出失效磁盘,其存储效率为k/(k+m)。在纠删编码的设计中,重构性能是其最重要的设计目标之一,在真实存储环境下,重构性能通常由恢复失效磁盘所用的重构时间来衡???,重构时间越短则重构性能越好,反之亦然。在理论分析中,由于重构过程中的计算开销比I/O开销快多个数量级,因而在理论比较中其计算开销可以忽略不计,因此校验阵列编码的重构性能可以转化成以存取数据块的个数来衡量重构性能。目前校验阵列编码的重构优化技术在学术界和工业界引起了广泛关注,主要分为以下几种研究趋势。
1.1 最优重构链长策略
针对MDS编码随着存储系统规模的扩大,其重构性能逐渐降低的问题,研究者提出了许多新的Non-MDS编码以提升存储系统的重构性能,如WEAVER编码[2],Hover编码[3],Pyramid编码[4],Stepped Combination编码[5],Code-M编码[6]和V2-Code编码[7]。Non-MDS编码相对于MDS编码在校验链的构建机制上使用了更多的校验块,减少了生成一个校验块所需的数据块个数,因此在相同存储规模的系统中,Non-MDS编码缩短了校验链的长度。在重构过程中,Non-MDS编码获得了更短的重构链长,在重构一个失效块的情况下需要读取更少的数据块,提升重构性能;此外,Non-MDS编码的重构链的长度不随存储系统规模的增长而变化,即重构性能与RAID规模大小无关,然而对于MDS编码其重构链的长度随着存储系统规模的增长而变长,因此其重构性能会逐渐降低。故设计新型高容错能力的Non-MDS编码成为提高重构性能的一种研究趋势。
1.2 最优重构数据量策略
对于现有的容多错阵列编码中,单磁盘失效恢复是最常见的问题[8],最初的重构策略便采用传统的恢复方式[9,10],即所有失效块的重构只考虑读取一种校验链的方式,该方式需要读取所有数据块用于重构,因而增加了存取I/O的复杂度;然而容多错的编码通常包含多种校验链(如行校验链、斜校验链和反斜校验链),每一种校验链之间都存在共用块的情况,因此最大化共用块的个数将会减少读取重构所需的数据量,从而达到提升重构性能的目的,这种重构方式称为混合校验链重建方式。如RDOR算法针对RDP编码的单磁盘失效提出了寻找最少重建数据块的快速重建方案[11];王等人基于最少重构数据量的思路实现了EVENODD编码单盘快速重构[12];针对任意多容错纠删编码的单盘恢复问题,Khan等人提出了一种枚举恢复算法,即寻找最小重建数据量[13];朱等人提出了一种替换恢复算法,加速了最少重构数据量的寻找过程,寻找到了次优的最少重构数据量[14]。
1.3 最优重构带宽策略
在分布式存储系统中,其重构过程中减少网络I/O开销是主要
您可能关注的文档
最近下载
- 电力电子技术阮新波习题答案.pdf VIP
- 2022年小学低段数学新课标解读心得体会(通用12篇).pdf VIP
- 2025贵州黔南州瓮安县招聘社区工作者50人考试参考试题附答案解析.docx VIP
- 统编版(2024新版)七年级上册道德与法治期末复习课件.pdf
- (完整版)动词单数第三人称练习题.pdf VIP
- 学术规范与论文写作(雨课堂)期末考试答案.docx VIP
- 《GBT27543-2011-手推升降平台搬运车》.pdf
- 办公室消防安全知识培训教育.pptx VIP
- 剪映短视频策划、拍摄、剪辑实战教程:短视频策划PPT教学课件.pptx VIP
- 河湖生态护岸工程技术导则.pdf VIP
原创力文档


文档评论(0)