架构设计:块存储方案(一).docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
架构设计:块存储方案(一) 现在的机械硬盘技术都格外成熟了,存储容量也消灭了几何级增长。但是机械硬盘的基本结构却一直没有太大的变化:它基本上是由机械臂(磁头臂)、主轴、多个成对的磁头和磁面构成。在每个磁面上被分成多个磁道、多个扇面和多个扇区,它们的具体存在方式如下: 磁面上会有多个磁道,它们在一个磁面上拥有不同的磁道编号。从磁面最外围离主轴最远的磁道到磁面最内侧离主轴最近的磁道,它们的编号从0开头,分别是0、1、2、3、4…….N(N大于等于10000,依据硬盘制造工艺不同而不同)。磁头将会顺着磁道基于磁面的转动读取数据,并且可以在各个磁道间切换位置。 实际情况下,外部将要存储到硬盘上的数据不会一次性写满整个磁道,读取数据到外部时也不需要读取整个磁道的数据。这是由于一个磁道被分为多个弧段,这些弧段称之为扇区。扇区是硬盘上存储数据的最基本物理单元。留意,目前市场上无论哪个供应商供应的机械硬盘产品,每个物理扇区单元固定的存储容量都是512字节。只是依据硬盘密度不一样,单位磁面下的扇区数量也不一样。既然扇区是数据存储的基本单元,就意味着一次硬盘读写操作的最小数据量就是512字节。 那么问题来了,是不是觉得512字节太小了点?是的,很多时候操作系统层面恳求读写操作的文件都会大于一个扇区的单位容量。那么在物理层面上就需要两个甚至更多个扇区来存储这个文件,那么怎样来规划存储一个文件的若干扇区在磁面上的分布,从而达到削减读取时间的目的呢? 操作系统层面会将物理硬盘上两个或者多个能够连续读取的扇区组成合并成一个区域,称之为“簇”。留意,这两个或者多个能够连续读取的扇区不肯定在物理上是连续的。这是什么缘由呢?这是由于硬盘转动的速度很快(标准速度为7200转/分),当磁头完成一个“扇区1”的读写后还来不及读取下一个连续的“扇区2”相邻的扇区就“飞”过去了,要等磁面再转动一圈到预定“扇区2”的位置才能连续进行读写。 所以一个簇在物理磁面的分布可能是不连续的。实际上各个硬盘生产商都会设置一个“跳动因子”来确定能够连续读取的扇区。如下图所示,四个不存在于连续物理位置的扇区构成一个簇。这样保证了磁面在旋转一圈的情况下就可以完成一个簇的全部读写。 最终说明一点,虽然扇面是硬件层面上机械磁盘读取数据的最小单元,但是“簇”才是操作系统层面上读取磁盘数据的最小单元。我们后文将讲解EXT文件系统和Btrfs文件系统,这两种文件系统定义的簇大小是不一样的。例如EXT文件系统的族大小可以有1KB(两个扇区)、2KB(四个扇区)、4KB(八个扇区)等多种选择。那么假如一个文件太小,不需要用完一个簇怎样办呢?没方法,它有需要使用至少一个簇的硬盘空间。也就是说,在操作系统存储一个文件时,即便一个簇没有占满,剩下的簇空间也不能再使用了。这就是为什么一个文件在操作系统上有两个大小:一个是文件的实际大小、另一个是文件占用硬盘空间的大小。 3-2、机械硬盘功能瓶颈 3-2-1、影响机械硬盘功能的因素 当需要从硬盘上读取一个文件是,首先会要求磁头定位到这个文件的起始扇区。这个定位过程包括两个步骤:一个是磁头定位到对应的磁道,然后等待主轴马达带动盘片转动到正确的位置,这个过程所花费的时间被称为寻址时间。也就是说寻址时间实际上包含两部分:磁头定位到磁道的时间为寻道时间,等待盘片转动到正确位置的时间称为旋转等待时间。 硬盘寻址的目的是为了找到将要读取的文件的起始扇区,并开头去取数据。这就可以解释为什么硬盘上读取一个100MB大小的文件和读取1000个100KB大小的文件时间是完全不一样的现象了:通常来说一个100MB的文件是存储在硬盘上可以连续读取的扇区上的,也就是说当硬盘需要读取这个文件时只需要进行一次寻址(为什么说是“通常”呢?由于前提是硬盘上至少要有一端连续空白的扇区,假如此时硬盘上碎片太多可能就找不到这样的连续空白区域了);而读取1000个文件时,由于这些文件的起始存储位不连续,所以每次都要进行寻址操作。寻址时间是评价机械硬盘功能的重要目标,这个目标和硬盘转数、磁头数有直接关系: 硬盘转速越快的硬盘,在同样的寻址算法把握条件下将能够更快的将正确的扇区转动到磁头下方。但是硬盘转速也不能做得无限快,由于硬盘转速越快要求的磁面工艺、主马达工艺也就越高,并且产生的乐音、温度也会成几何级添加。现在民用级、商用级和工业级硬盘上最常接受三种转速选择:5400转/分、7200转/分和10000转/分。 磁头数,现在的机械硬盘中一般都包含了多个盘片并且分别使用独立的磁头。这样做的次要作用是在硬盘密度不变的情况下添加机械硬盘的容量。实际上这样的做法也可以添加肯定的硬盘功能,由于读取存储在不同磁面上的文件时,它们的寻道时间可以相对独立。但是其对功能的提示只能是有限的,由于这些盘片共享同一个主轴马达。 机

文档评论(0)

duanbingbing + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档