EVA缓存白皮书.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
EVA 的缓存 为什么小却依然性能卓越 企业级高档手动自动一体化的存储阵列 Alex Chu 朱圣瑜 中国惠普网络存储方案产品部技术中心经理 Alex.Chu@ 简介 为了提高性能,存储控制器经常要使用高速缓存来减轻磁盘的机械存取的影响。缓存的提供数量是 在最初的设计阶段决定的,不同控制器之间的缓存数量有着很大的差异。另外,它还在很大程度上 取决于操作系统环境,也就是说,大型机(MainFrame )IO应用程序一般要频繁地访问存储上的缓 存,存储子系统上的缓存越大,它就受益越大。另一方面,开放操作系统应用程序一般将IO请求储 存在服务器内存中,结果是产生对存储子系统错过缓存(Cache-Miss)的密集的IO请求。这样,大量缓 存就不会为开放系统应用程序带来任何益处(必须等待从物理后端磁盘的实际读操作来满足存取)。 人们常问的一个问题是,EVA在只有2 GB高速缓存的情况下为何会有如此出色的性能?答案是EVA 专门为开放系统环境量身定制,与前面几代业界领先的存储控制器有着很深的渊源。HSG-80 (MA8000和EMA12000上使用的)控制器只有1 GB高速缓存,但在开放系统工作负荷的环境中,性 能却往往胜过配有8GB或16GB缓存的竞争对手的存储控制器。(例如在 L 的 HSG80 与 Symmetrix 的 UIOX 性能测试的结果)。 这个令人讶异的事实背后的原因,在于典型应用程序访问存储器的方式与HSG80上内嵌的缓存算法 的结合。这些算法在EVA HSV-1x0控制器上 (EVA系列)得到大大增强,它们能够以最少的高速缓 存提供更高的性能。这些算法产生的结果,就是人们所达成的共识:“重要的不是大小;而是如何 使用!” 本文余下部分稍微详细地讨论应用程序如何访问存储器,以及EVA如何利用这个信息,在最大限度 减少高速缓存数量的同时,实现缓存效率的最大化。 缓存的功能 控制器缓存的主要用途,是隐蔽由于磁盘存取的机械性质而产生的较长的服务时间。当前磁盘驱动 器的平均存取时间以毫秒计,而高性能控制器的缓存存取时间一般小于200微秒。由于磁盘存取花费 的时间要比缓存存取多30到40倍,因此高效的缓存算法可以对总体的存储性能产生显著的影响。 根据I/O 的工作负荷,控制器缓存算法的主要功能可以分为四个方面:随机读,顺序读,随机写,顺 序写。为保证良好的性能而需要的缓存数量取决于是否有针对其中每个方面的算法,以及这些算法 的设计和执行的优秀程度。 为了理解这四种工作负荷为什么有如此之大的差异,以及为什么需要个别的缓存算法,我们将花一 点时间研究各个I/O工作负荷,以及专门为这些工作负荷开发的EVA算法。 2003年4月14 日 第1页 随机读 读缓存可以减少重复访问相同数据的磁盘存取。在访问磁盘存储块时,假定(或者希望)会再次访 问相同的数据,因此将数据置于缓存中。如果主机再次访问该数据,则数据可以直接从缓存返回, 从而避免磁盘访问。尽管这看起来是一个不错的方法,但从现实的角度看还是有一些问题: 1. 随机访问磁盘驱动器意味着缓存命中(hit)机率的可能性非常低。例如,如果应用程序随机访问一 个1 TB的文件,控制器就需要1 TB的缓存。大部分交互式的数据库应用程序都是随机访问,因 此读缓存的帮助很小,因为几乎所有的访问都错过(miss)缓存。如此一来,大量的读缓存对于随 机访问工作负荷而言帮助甚少,甚至没有任何益处。 2. 从磁盘读数据时,必须在缓存上为那些新数据准备空间,因此较早的数据将被移走。在随机存 储带来的高缓存错过概率与数据库的高I/O速率情况下,这意味着控制器增加了额外的开销及附 加的延迟时间。此外,由于其它的随机读的缓存错过活动,缓存中会被访问的任何数据都有

文档评论(0)

0520 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档