基于检查点长时应用容灾方法研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于检查点长时应用容灾方法研究

基于检查点长时应用容灾方法研究   摘 要:针对带有时间约束的长时关键应用面临的容灾需求,提出一种基于检查点的应用容灾方法,在应用运行过程中定期保存应用的中间运行状态,并将中间状态异步传输到异地,灾难发生后应用无需重新运行,可自动从最近的检查点位置接力运行。给出自适应的检查点参数设定方法,并构造原型系统验证了该技术的有效性。   关键词:检查点;信息系统;时间约束;持续性数据保护   中图分类号: TP393   文献标志码:A      Researches on disaster recovery methods of   longrunning applications based on checkpoint      CHEN Haitao, LU Yutong, WEI Zhongwei      School of Computer, National University of Defense Technology, Changsha Hunan 410073, China   )   Abstract: A new application disaster tolerance method was proposed to meet the disaster tolerance requirements of timeconstrained longrunning applications. The method saved the middle running states of applications periodically and transfered these states to backup servers asynchronously. After disaster happened, application could resume from the latest checkpoint. Method of setting the checkpoint parameters was provided too. The prototype has verified the efficiency of the method in simulation environment.      Key words: checkpoint; information system; time constraint; Continuous Data Protection (CDP)      0 引言   随着信息化时代的推进,关键信息系统的可持续运行能力直接影响到人们的日常生活、社会的稳定以及国家的安全,如何确保关键信息系统在各种灾难状态下的持续服务成为一个关键且具有挑战性的问题和研究热点。   根据应用运行的时间特点,可将应用划分为短服务流程应用和长服务流程应用。短服务流程的应用特点是用户访问源源不断但单次服务时间通常为分钟级别以下,例如网页访问、信息搜索服务、存取款等短事务应用。长服务流程应用的特点是用户提交任务然后等待运行结果,单个任务需要经过复杂的计算或者搜索过程,单次服务时间通常为分钟或者小时级别以上,例如气象预报应用、军事部署方案生成。   当前仍处于主流的主备切换容灾方法是在异地部署相似的软硬件配置,通过数据备份或者复制技术保持应用数据同步,检测到灾难发生后启动备份应用提供服务。该异地重启模式适用于短服务流程应用的容灾,在异地备份服务器上重启被中断的应用导致的应用停顿时间通常为分钟级以下,仅丢失处于服务状态的用户访问。因为服务状态短,用户可通过简单地重新提交服务请求恢复被中断的访问。对于短服务流程的应用,其容灾研究重点在于确保数据同步和事务一致性。   但对于长时应用尤其是带有时间约束的长时应用,其容灾需求不能通过简单的在备份位置重新启动应用获得满足。例如对于一个需要2小时运行时间,而且必须在启动后2.5个小时内获得结果的并行气象应用,如果在作业运行1个小时后发生灾难,则尽管气象应用能够在异地重新启动,但无法满足2.5小时的时间约束要求。对于长时应用,通常的异地重启模式导致用户访问延迟很大,尤其不能满足具有时间约束的长时应用的容灾需求。   针对带有时间约束的长时关键应用面临的容灾需求,本文提出一种基于检查点的应用容灾方法:在应用运行过程中定期保持应用的中间运行状态,将中间状态异步传输到异地,灾难发生后应用无需重新运行,可从最近的检查点位置接力运行。   1 相关工作   关键信息系统的容灾具有重要的应用价值,受到日益广泛的关注。容灾技术涉及数据复制和恢复技术、高可用技术、集群、网络技术等多个相关领域,国内外的最新研究进展主要集中在以下方面。

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档