存储管理中梯度策略的研究与设计.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
存储管理中梯度策略的研究与设计.doc

存储管理中梯度策略的研究与设计 摘 要 数据量的增加,虚拟机的增多都对存储空间提出了严峻的考验。文章结合实际工作中遇到的存储空间紧张的问题,探讨了一种梯度存储管理策略,该策略以数据价值为依据,结合同步触发式监听程序,实现数据信息的自动化转存,并通过带有权重值的价值评估函数确定需要进行转存的数据。最后,设计实验对该策略的可行性进行了验证,结果表明,梯度存储策略能够有效地对数据存储进行管理,并使得紧缺的存储资源配置得以优化。 关键词 存储管理;梯度策略;价值评估 中图分类号:TN919 文献标识码:A 文章编号:1671-7597(2014)09-0166-02 服务器虚拟化使得物理机的使用效率得以大幅度提升,但也给存储带来了新的问题,虚拟服务器要比物理服务器多消耗约30%的磁盘空间,同时,迅速增多的虚拟机产生的数据将对存储空间造成极大的压力,而现有的存储架构无法有效地解决虚拟机产生的随机I/O的问题。在不减少虚拟机数量的前提下,只有改进现有的存储管理策略,对重复数据进行删除,对备份和镜像进行精简,才能实现对存储进行更为有效地利用和管理。 1 数据转存策略分析 目前对于数据的分级存储普遍沿用空间高低水位算法和Cache替换算法。高低水位算法根据磁盘空间的剩余情况来决定数据的存储位置,该方法充分考虑了磁盘的利用率,却忽略了数据自身的特性。替换算法则参照计算机系统中内存的管理策略,衍生出相应的LRU、LFU等策略。LRU算法以最近最少使用为原则,将数据移出磁盘,该算法实现简单却没有考虑数据的大小对系统性能造成的影响。LFU算法关注数据被访问的次数,从总体上考虑了数据的使用频度,但需要具备相应的失效机制,否则会导致历史数据长期占用存储空间,造成资源浪费[2]。综合上述分析,本文讨论了一种带有权重值的数据存储模型,该模型可以根据用户关注的重点设置权重,以适应不同的数据存储环境。 2 梯度存储策略 在存储级别划分方法上,根据存储介质所处的状态,将其划分为Online,Oncall和Offline三种。Online状态的存储介质,实时响应系统请求,及时存储和提供需要快速访问的数据,特点是速度快,价格高,存储空间有限,此类存储包括FC磁盘,SCSI磁盘阵列和闪存等。Oncall状态的存储介质在存取速度上不及高速存储介质,而在价格上比高速磁盘有优势,此类存储介质用于存放访问频率不高的数据,SATA磁盘阵列和光盘等可作为此类存储介质。Offline状态的存储介质主要用于存档和灾备,此类介质价格低,容量大,如磁带等。 整个存储系统被划分为三个梯度,一级存储实现数据的高速访问,二级存储作为一级和三级存储的缓冲区,三级存储用于数据归档。数据的转存操作须满足一定的触发条件才可以执行。由此,引入数据的价值评估函数。 3 价值评估函数 数据转存策略的制定,既要考虑数据的生命周期,还要参考访问数据时对存储的性能需求以及容量要求[3]。根据数据的生命周期管理理论,新产生的数据将被频繁访问,具有较高的价值。长期不用的数据则向下转存,直至归档或销毁。研究生命周期的方法模型包括波浪形,环形,链型,螺旋形等[4],就数据价值的生命周期而言,其生命特征符合波浪形趋势。 图1 数据价值随时间变化示意图 由图1可以看出,数据从产生到使用,再到归档,其价值时刻变化。数据的价值会因长时间没有使用而出现折损,也会因为被再次使用而出现回升。因此,将数据的价值作为转存的重要依据。 由此,给出数据的定义[5]:D A1,A2……An ,其中Ai是数据D的属性。数据的固有属性包括数据的大小(S),数据的被访问时间(T),数据读写的频率(F),数据涉及的用户数(Q),数据间的关联程度(C)等。在这些属性中,关注对数据的价值影响大的因素,因此,保留以上属性的S、T、F、Q作为影响因子。 数据的访问时间决定了该数据的“热度”,越是频繁被访问的数据其价值越高。将数据被访问的时间与当前时间的差值记为T1、T2……Tk,定义T的计算公式为T ∑1k,定义数据的 读写频率F ∑(Ri+kWi),其中,k作为读、写操作的代价修正系数,Ri和Wi表示读、写次数。Q表征了有多少用户使用该数据。较大的数据在转存时对系统造成的影响较大,对存储的容量也会有明显的影响,因此,在数据的价值评估函数中要体现S对其价值的影响。 综上所述,得出数据的价值评估函数(V表示数据的价值): V +T+F+Q (1) 根据对各因素关注程度的不同附加权重,可以更好地体现该因子对数据价值的影响程度,同时也可以提高函数的适应度。经过权重修正后,公式(1)变形为如下形式: V +wtT+wfT+wqQ (2) 4 实现方法 实际工作中的梯度存储涉及到两个方向的数据转存,即“热度”较低的数据向低级存储转存,“热度”较高的数据转存至高级存储,前者

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档