- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
连续数据保护
随着全球化信息时代的到来,数据的重要性已经不言而喻。然而数据的存储载体很容易受到软硬件失效、自然灾害、人为过失、病毒入侵等威胁而导致数据损坏或丢失。当前的副本、纠删码等技术能够有效地防止存储系统硬件失效的问题,但无法有效防止人为过失,软件失效和病毒入侵给数据带来的危险。因此现代存储系统的重要需求就是能提供连续数据保护功能{Damoulakis, 2004 #1},即在不影响正常数据业务流程的情况下,实时记录或跟踪所有数据的修改,并且能将数据恢复到任意指定时刻的状态。
连续数据保护技术发展现状
大多数数据保护技术只能将数据恢复到最近或特定的时间点时的状态,而对于某些重要数据业务如电信、银行、电子商务交易等,如果能恢复到任意时间点的数据状态,将会为业务的故障排除提供很大的方便。因此连续数据保护(Continuous Data Protection,简称CDP){Damoulakis, 2004 #1}的概念应运而生,所谓连续数据保护是指在不影响正常数据业务流程的情况下,实时记录或跟踪所有数据的修改,并且能将数据恢复到任意指定时刻的状态的数据保护机制。CDP系统能够提供块级、文件级和应用级的备份,以及恢复目标的任意可变的恢复点。当前连续数据保护技术已成为研究的新热点{Yang, 2006 #2},美国罗德岛大学杨庆教授在TRAP{Yang, 2006 #2}一文中,根据不同数据保护技术的恢复指标,将其分为四个等级——TRAP-1到TRAP-4。(任意时间点的适时恢复,Timely Recovery to Any Point-in-time,简称TRAP)。本节首先介绍数据恢复的技术指标,然后在阐述各TRAP等级过程中介绍各个实现机制的原理和研究现状,最后对各种实现技术进行对比。
数据恢复的技术指标
在实际应用中数据恢复可以有两个指标来衡量:恢复时间点(RPO)和可恢复时间(RTO){Keeton, 2004 #3}。RPO是指能把数据恢复到过去的某一个时间点,RTO是指在出现问题后“什么时候”可以恢复数据。
RPO可简单地描述为用户可容忍的最大数据丢失量。例如,如果数据错误出现在t0时刻,而发现错误是在t1时刻,则最理想的是将数据状态恢复在t0前的时刻,或尽可能接近t0时刻。例如对于传统的数据备份方式,一般都是每天做一次备份,而且通常是在晚上进行。如果第二天出现错误,则从备份完成后到错误出现时所写入的数据都将无法挽回了,如果这期间没有备份,数据就会丢失。最坏的情况是如果错误出现在一天结束时,那么当天的数据都会丢失,这种情况下,RPO就是24小时。
RTO可简单地描述为用户可容忍的恢复时间。它表示的是恢复数据到正常状态所耗费的时间。仍然是上面的例子,如果从t1时刻起开始恢复数据,直至t2时刻恢复了所有数据,则RTO就是t2-t1。
由上可知,在数据保护技术中要求RPO和RTO值越小越好,但减少RPO和RTO是需要付出一定开销和代价的,因此要针对不同的应用选用RPO和RTO相匹配的存储架构。
数据恢复级别
根据目前具有数据恢复能力的存储架构的RPO和RTO的不同,可以将这些系统划分为4种级别来分别讨论。
TRAP-1
最传统的数据保护和恢复的方法就是采用定期的备份{Rock, 2005 #4}、镜像{Chervenak, 1998 #5}和快照{Duzy, 2005 #6}。由于备份通常要消耗大量的系统资源,会影响正常业务的性能,而在夜晚数据存储系统的业务量通常没有或很小,因此备份放在夜间进行。为了节省空间,通常是每天做一次增量备份,每周或每个月做一次完全备份,有的系统还会对备份数据进行压缩保存{Rock, 2005 #4}。
快照就是对数据集合的一个拷贝,它包含一个数据在开始拷贝的时刻的映像,使得用户可以在正常业务应用不受影响的情况下,实时提取当前在线业务数据{Duzy, 2005 #6}这意味着,用户在进行系统数据备份,从而大大增加了整个业务系统的连续性,为实现真正的724运转提供了保证{Lee, 1996 #7}{Corporation, 1998 #17},文件系统{Cox, 2002 #8}{Kistler, 1992 #9},附网存储系统(NAS) {Sankaran, 2004 #10}及备份软件中。快照根据工作原理的不同可分为:分离镜像(Split-Mirror)、写前拷贝(Copy-on-Write,CoW)){Xiao, 2006 #11}{Sankaran, 2004 #10}。
尽管近几十年来计算机的各方面技术得到飞速发展,但数据备份却很例外,因为二十多年来这项技术并没有任何明显改变。备份和快照仍然都需要消耗大量的时间和存储资源,过于频繁的备份和快照操作会严重影响系统正常数据业务的性能,因此备份的
文档评论(0)