- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
远程数据备份系统的缓冲机制研究
湛文韬 李战怀 姜楠 王超
(西北工业大学计算机学院,陕西省西安市,710072)
摘要:针对远程数据备份系统的一致性要求,提出了日志队列来保证一致性.接着在分析了
一致性带来的系统性能影响以及讨论了单缓冲的缺点和不足的基础上,引入了双缓冲策略.缓
冲策略很好地减少了本地设备IO操作,增大了备份端吞吐量,并能应用批量并行lO机制,很
好地保证系统性能.
关键词:一致性;双缓冲;并行IO
1.引言
随着计算机的广泛应用,数据已经成为开展业务不可缺少的基础。对企业和组织来说,
数据丢失所造成的损失往往是无法挽回的。因此,建立备份系统,提高计算机系统的可靠
性与容灾能力,保证业务连续运行,已成为研究热点。
静态、定期数据备份(例如磁带备份)是一种传统的数据容灾方式,这种方式的主要
缺点是在实施备份时需要停止应用系统运行,备份周期也比较长,在发生灾难时,备份的
数据与实际应用系统数据可能相差很远。同时考虑到大范围灾难,如地震、飓风等自然灾
害和恐怖袭击等人为灾害,需要把备份地点选在几十公里之外才能避免数据丢失和业务瘫
痪,这些都对传统备份技术提出了挑战。
远程数据备份【l】是一种热点数据备份技术,已经成为实现实时、远程容灾的主要手段。
Data
远程数据备份系统(Remote
Backup
通过截获本地主服务器上的写请求数据,在更新主服务器数据卷的『一时将更新发往备份服
务器的数据卷保存数据副本。
2.RDB的一致性
对于大部分用户来说,进行数据备份、镜像等工作的最终目标不仅仅是为了获得一个
数据副本,最主要的目标是在本地存储介质发生故障时,可以利用远端备份数据进行恢复
或者把应用程序迁移到备份的数据上重新启动。因此,备份(或者复制、镜像)数据的可
恢复性是衡量上述各种技术的关键因素。在Oracle数据库管理系统中,事物的执行过程需
Redo
要按照特定顺序依次更新OnlineLog、控制信息、数据表等。如果数据复制过程中不
能保证更新顺序,则很可能造成本地数据的不可恢复。
基金项目t国家自然科学基金(60720106001)
联系作者I湛文韬·E-mail:zhanwti984@163.conl
170 第3部分数据库与存储技术
数据一致性要求
定义1 如果在任意时刻t,总存在对应的时刻f’(,’≤f),使得备份服务器上的数据备
份在时刻f的状态与本地主服务器数据在时刻f’的状态相同,则认为备份数据是一致的或
者是可恢复的。
为了保证在任意时刻备份数据的一致性,必须保证备份服务器上备份数据的更新顺序
J。为了保证
和本地服务器上数据的更新顺序相同,这也被称为Write—orderFidelityll
Write.order
Fidelity,本地数据服务器需要把存储介质上的每个写请求按照其到达的顺序保
存到一个确定的请求序列中,然后序列中的所有请求数据将严格按照到达顺序发送到远程
备份服务器。通常这个序列被组织成请求队列的形式,保存在内存【3J、闪存14J或者是本地
的磁盘或卷上【2’5J。内存虽然访问速度较快,但它是易失行存储介质,容易受断电等的影响
导致数据大量损失,因此不适用于需要进行数据恢复的场合,如本文的RDB系统。闪存
虽然也属于非易失性存储介质,访问速度也比较快,但目前发展还不是很成熟,尚处于试
用和推广应用阶段,因此RDB系统也没有引入闪存。RDB的请求队列保存到本地存储介
质一磁盘上。由于存储宅问的限制,请求队列被设计成循环使用的一块存储空间,以保
存最近一段时间的历史更新,这样也能更有效地利用存储空间,避免浪费。保存请求队列
的存储设备记录了最近执行的更新请求以及主从服务器的状态信息,RDB中称之为日志队
Queue,LQ)。
列(Log
在数据一致性这个前提下,LQ不仅是本地存储设备写请求的记录者,也是远程复制
的数据源。RDB捕获了系统数据后,不仅需要严格按照顺序写入LQ,还需要严格从LQ
中读出数据,写入本地存储设备,同时严格按
原创力文档


文档评论(0)