云时代还需要.docxVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
云时代还需要

云时代还需要RAID吗?[复制链接]flypenflypen 当前离线 在线时间9 小时阅读权限10积分9UID71020IP卡狗仔卡新手上路新手上路, 积分 9, 距离下一级还需 1 积分多币10 威望9 注册时间2009-2-2精华0帖子10串个门加好友打招呼发消息电梯直达 1#发表于 2010-8-22 12:23:24 |只看该作者|倒序浏览0来源于:/?p=321. 前言RAID(Redundant Array of Independant Disks,独立冗余磁盘阵列),已经火了二十来年,在存储领域一直是速度和可靠性的代名词。专业的存储,没有看见谁不用RAID的。RAID提供了很多级别,常用的有0,1,5,6,10等。其中,兼顾性能(数据并发访问)和可靠性(利用冗余来提升)的RAID5,6,10是在实际应用中利用得最多的,尤其是RAID5,几乎成了考察磁盘阵列性能的首选测试级别。除了专业存储的设备(NAS,SAN等),普通操作系统对RAID也有很好的支持,比如Linux内核中的md模块就是用软件来实现RAID的,同时在用户态有一个管理程序mdadm能够对RAID进行复杂的配置。本文以分析RAID5为主,来谈谈云时代RAID技术所遇到的一些情况。RAID5能够容忍任意一块磁盘出错,保证在出错的时候磁盘仍能顺利读写。在大多数人看来,两块磁盘同时出错的概率并不是很高,所以一般认为RAID5也就足够用了。且现在的磁盘阵列都提供热备盘,只要有盘出错,就会自动把空闲盘加入RAID5中,利用剩下的好盘重建数据,把计算出来的数据写入新盘。当数据重建完成之后,该设备就完好如初了,又能容忍任意一块盘再出错。看上去似乎很不错。假设一个RAID5设备由n块磁盘组成,则实际存放数据的磁盘有n-1块,另外一块盘用来存放Parity(校验码,RAID5的校验盘是分散在每个磁盘中的,合计共用一块盘),则数据的有效利用率是(n-1)/n,这是一个比较高的值,尤其是当n比较大的时候,它的利用率就越高;该设备能够并发访问(n-1)个盘的数据,理论上也可以达到单盘速度的(n-1)倍,这也是很高的一个值。看来,RAID5在速度,空间利用率,容错性上都得到了很好的平衡,理所当然地成为许多人的首选了。事实果真如此吗?RAID是在1987年提出的,那个时代,硬盘还是非常昂贵的设备,RAID的优势在于能够在控制整体成本的基础上兼顾性能和容错。如今,磁盘越来越廉价,数据本身越来越重要,时过境迁,一些应用模式也发生了根本的变化。如今,Google的文件系统,Hadoop的HDFS等分布式文件系统大行其道,它们有一个共同的特点,都是利用简单地把一组数据复制到多个计算节点的方法来实现冗余的,单机并不做RAID(最多做不损失容量不提供冗余的RAID0),已经抛弃了传统的RAID概念。这样看似成本会高不少——在传统的RAID中,提供数据冗余可靠只需要多用一两块磁盘就可以了,但现在却得多好几倍的磁盘数(一般情况下冗余度至少为3,也就是说至少要用3倍于原始数目的磁盘),还得采购更多的计算节点,这,成本不是高那么一点点吧?下面我会从可靠性,性能和成本三个方面对RAID加以分析。2. 可靠性云计算,可靠性是用户担心的首要问题。要达到宣传中所提及的99.99%的UPTIME(正常运行时间),一年也就只能宕机一小时左右。如果有过两三次不能正常使用的情况,用户无疑会对这项业务产生怀疑。用户的不信任是云计算商业运用的一大杀手,保证可靠性对云计算提供商来说,无疑是最紧迫的任务之一。也许部分用户的业务不需要如此高的可靠性,但是既然作为云计算,服务的对象就是千千万万的大众客户,总有一些人是需要很高的可靠性的。更重要的是,媒体对这种事情非常敏感,他们的宣传,如同一把刀架在提供商的脖子上面,逼迫他们不得不提供原高于正常水平的可靠性。否则,谁会用你呢?1.1 硬盘的高坏盘率RAID5只能提供一块磁盘的容错率。但是,硬盘的坏盘率其实是很高的,尤其是在服务器上,硬盘始终在工作,很少有休息的时候。据Google的论文(/papers/disk_failures.pdf)报告,硬盘的年坏盘率为1.7%-8.6%。显然,在一小段时间内,两块或者更多的磁盘坏掉的可能性并不是那么小。也许可以不选择RAID5,而采用RAID6。的确,仍使用RAID的许多高可靠性系统中,也有不少是采用RAID6的。RAID6能够提供任意两块盘的容错率,但是由于要生成两组校验码,所耗费的资源也比RAID5大不少。1.2 RAID的长时间重建(rebuilding)当有盘坏掉的时候,会加入热备盘来重建数据。现在的磁盘容量都很大,以使用得最多的SATA盘和典型容量1TB为例,一般来说,单盘速度可以到100MB/s,假设重建数据的过程全速运行,

文档评论(0)

rovend + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档