系统容灾方案.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
系统容灾备份方案 2015年6月 目录 TOC \o 1-5 \h \z HYPERLINK \l bookmark2总则 2 1」适用范围 3 HYPERLINK \l bookmark4应急人员名单 3 HYPERLINK \l bookmark6系统总体架构图 4 HYPERLINK \l bookmark8硬件设备应急方案 4 4」 硬件设备应急内容 4 4.2主机异常宕机且硕件报错 4 4.3主机操作系统无法正常启动应急处置 5 4.4主机数据和存储崩溃应急处置 6 HYPERLINK \l bookmark10服务器应急方案 7 5」主机操作系统检测 7 应用程序服务检测 7 5.2.1故障场景及应急操作 7 5.2.2故障恢复验证 9 双机软件检测 10 5.3.1双机检测 10 数据库应急方案 10 1总则 1.1适用范 本操作手册适用于Bankeys后台系统出现主机硬件、系统程序、数据库系统 紧急情况吋的应急处置。相关紧急情况信息如下: ?主机紧急情况色括:主机服务器宕机,主机破件报错、硕盘储存空间不 足等情况。 ?系统服务器紧急情况包括:主机操作系统不间断重启,系统宕机,系统 报错,程序服务报错无法重启,主备机无法正常切换等情况。 ?数据库紧急情况包括:主机操作系统不间断重启,系统宕机,系统报错, 数据库无法启动,主备机无法正常切换等情况。 出现上述紧急情况之一,应立即上报信息系统应急指挥领导小组,经领导同 意后立即启动相应的处理流程。 2应急人员名单 序号 成员 角色 联系方式 备注 1 2 3 4 3系统总体容灾架构图 架构说明: 4硬件设备应急方案 4.1硬件设备应急内容 主机服务器设备紧急情况包括: 主机异常宕机,主机硬件报错; 设备操作系统无法正常启动; 设备数据和存储崩溃; 若发牛上述紧急情况,立刻通知电信系统维护岗工程师到现场,同吋维护 厂商的IBM专项工程师也必须到达现场,且维护厂商的电信PM (维护项H 经理)也应立刻知晓并进行调度。若发牛需要协调原厂工程师到达现场Z情 形,则由维护厂商的电信PM进行原厂报修派单,备件原则为未过保设备由 原厂经维保厂商提交报修后提供,在特殊需求下,维保厂商可以预先提供故 障备件先行恢复业务后,由原厂提交的备件在业务非繁忙吋段进行替换,替 换工作的流程调度,吋问点由系统维护岗工程师安排,经领导批准后方可进 行。 4.2主机异常宕机且硬件报错 判断标准: ?检查服务器面板指示灯颜色情况; ?检查服务器背而电源指示灯情况; ?检查服务器背而网卡指示灯情况; 参考标准: ?如果服务器而板指示灯闪烁,说明服务器处于关机状态,如果面板指示灯黄 色说明服务器存在故障,如果面板指示灯绿色说明服务器运行正常。 ?电源指示灯如果未点亮,说明电源处于停止工作状态,如果电源指示灯黃色 说明电源故障,如果电源指示灯绿色说明电源工作止常; ?网卡指示灯如果长亮或不亮说明网卡故障,网卡指示灯闪烁说明工作正常; ?硬盘指示灯如果是黄色说明硬盘故障,硬盘指示灯如果为绿色闪烁说明硬盘 工作正常。 如发现硬件设备有如上异常情况应急处置办法如下: 如果机器能进操作系统,木地登陆主机,记录保存、错误日志;若发牛 事故吋,己经直接宕机,则跳过; 2?硕件故障的查看、分析和诊断;如核实设备出现错误代码,分析设备报 错H志等。 3.如果确定报错信息,进行故障定位,更换相应部件。 4?如果机器进不了操作系统,在机器开机的时候通过主机的管理CMM系 统管理接口登陆或本机串口登陆,然后查看系统屮各种硬件的信息和警 告; 手工切换HA资源,强制备机进行接管主机的操作; 如手工切换失败,则分析□志(LINUX系统HA启动、停止的□志文件 名是:/var/log/messageso判断是否由以下原因引起:IP地址资源无法接 管、应用程序启动失败、相关资源启动失败; 在备机上根据依赖关系,手工启动所有资源; 更换坏件后,重新开启主机电源并进行自检,确保新件可以稳定工作; 启动操作系统、数据库及应用,并查看相关口志信息确保无异常信息。 4.3主机操作系统无法正常启动应急处置 判断标准: 主机日常由于维护、修改参数或者硬件更新的操作,可能需要重新启动,若 启动无法正常完成,则可以判断为“操作系统无法正常启动”情况。 应急处置办法: 系统不能正常启动,必须进入维护查看磁盘状态。--般是因为系统异常 根据启动信息判断,是否引导设备的路径出现问题?如是,重新设定启 动设备路径,正常引导操作系统; 启动过程屮,是否提示启动设备引导块丢失?如是,将主机启动至单用 户模式下,修复启动设备引导块,重新引导操作系统; 启动过程小,是否提示系统文件岀错?如是,将主机启动至光盘单用户 模式下,修复系统文件,

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档