- 1、本文档共47页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
虚拟环境下崩溃场处理的优化
虚拟环境下崩溃现场处理的优化 摘要
摘要
系统崩溃现场处理(core
dump)是指在系统崩溃时将系统状态保存在永久
性存储器(persistentstorage)中的过程。被保存下来的系统崩溃现场可用于调试
和分析,以寻找系统崩溃的原因并加以修复。当今的硬件服务器通常配备了大量
的内存。所以,当它运行的操作系统崩溃时,保存其系统崩溃现场的过程十分耗
时。只有系统崩溃现场处理完成以后,才能重新启动服务器系统,以继续提供应
用软件服务。因此对服务器进行耗时的系统崩溃现场处理显著延后了执行系统重
启以恢复应用软件服务的时刻,造成了较长的系统宕机时间。另一方面,如果为
了尽快重启系统而选择不进行系统崩溃现场处理将导致系统崩溃现场丢失,失去
了分析系统崩溃原因的重要线索,导致未来可能发生类似原因的系统崩溃。
在本文中,我们针对虚拟化环境中的虚拟机(virtualmachine,简称VM)
系统崩溃现场处理,提出了多种优化,来缩短虚拟机崩溃时因为系统崩溃现场处
理和重启虚拟机而引发的系统宕机时间(downtime)。首先,我们将系统崩溃现
场处理和重启虚拟机这两个过程并行化执行。为了实现并行化,需要在当前虚拟
机崩溃后,创建并启动另一个恢复虚拟机(the VM),在恢复虚拟机中
recovery
继续中断了的应用程序服务;在针对崩溃的虚拟机进行系统崩溃现场处理的过程
中,需要一边保存它的系统状态,一边动态地回收已经保存了的崩溃的虚拟机的
内存,并将它分配给恢复虚拟机。其次,我们可以选择性地只保存系统崩溃现场
中对调试分析系统崩溃原因有意义的部分,而不是简单地保存整个系统崩溃现场,
VM
从而减少系统崩溃现场处理的时间。为此,我们通过虚拟机管理层(the
managementlayer)访问崩溃的虚拟机的内存数据,从中找到关键的数据结构加
以分析,以忽略那些与系统崩溃原因无关的内存状态。最后,在系统崩溃现场处
理和新创建的恢复虚拟机之间,我们在虚拟机管理层平衡两者的磁盘I/O速率。
根据用户调整得到的最佳磁盘I/O速率控制策略,我们在系统崩溃现场处理的速
度和恢复虚拟机的启动速度、提供服务的质量之间进行了权衡。
我们实现了系统原型,称为Vicover,来优化Xen虚拟化环境中虚拟机系统
崩溃时的系统崩溃现场处理,从而最小化由于系统崩溃现场处理和服务恢复所引
起的系统宕机时间。在一台虚拟化的TPC.W服务器上做的实验中,Vicover将系
统崩溃现场处理引起的系统宕机时间缩短了5倍。
关键词:系统崩溃现场处理;并行化;虚拟机
中图分类号:TP316
第1页
Abstract
Crash core isthe tosave on
dump,Ordump typicalway memoryimagesystem
crashforfutureoffline and servermachines
analysis.However,fortypical
debugging
with abundant timeofcore can increasethe
likely memory,the dumpsignificantly
meantimeto thercboot-bascd not
repair(srrra)bydelaying recovery,while
thefailureconte
文档评论(0)