第4篇动车事故让双机服务器警醒.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4篇动车事故让双机服务器警醒

新闻资讯 “动车事故”让双机服务器警醒 ________________________________________________________________________ 甬温线动车事故牵动了全国人民的心。对于事故原因,有很多的说法,有说 雷击的,也有说信号控制错误的,也许真正的原因还有待有关部门最终的调查结 果。但有一点事实,故障造成了无法挽回的损失,逝去的生命已经无法挽回,教训 是非常惨痛的。 为什么总在一些原则性的问题上跌倒?这不仅指铁道部门,在IT 应用中, 也经常有这样的事情发生。在需要可靠性保障的关键业务应用场合,为了保障业务 连续性,国内用户常常选择双机冗余的方案,而不是选择容错机。但在国外,用户 一定会选择容错机。 对于国内用户为什么不选择容错机,很重要的一个理由就是价格贵,资金预 算有限。目前容错机的价格大体分为高中低档,价格为60 万、40 万和20 万不 等。这相当于多路服务器的报价,较之双路服务器高出很多。在这种情况下,用户 常常选择双机冗余方案来提升可靠性。 从技术上看,双机冗余所解决的是故障后的业务恢复问题,也就是说,在一 定的时间段内,恢复系统运行,来保障业务的连续性。这就意味着,系统会有一定 的中断时间。对很多业务而言,这种业务中断是可以的,例如邮件系统、保险下单 系统等。但是对于有些业务,这种中断是不能够承受的,例如证券交易、银行交易 以及工业控制系统等,业务中断就意味巨大损失,据统计,金融企业每次宕机损失 平均为1000 万美元。 也许会有用户认为,双机冗余系统能够做到零中断切换,当系统故障时,自 动切换到冗余的服务器。这只是一首好听的歌,实际上根本无法实现。原因很多, 有监控问题,也有系统的同步问题。所谓零切换,也就是在演示阶段,实际上很难 实现。究其原因,双机冗余的设计目的,并不是系统不中断,而是系统中断后,业 务的连续性问题。 1 / 2 新闻资讯 解决系统不中断,保持业务连续可用,就只有采用容错机的方案。在国外, 这几乎是用户的一种共识。要想系统不中断,可行的办法就是消除故障的隐患,就 硬件层面而言,这种故障可能来自处理器,也可能来自缓存、内存、总线和I/O, 那么容错机,通过锁步技术,销售了硬件故障的可能性,从而为系统提供所需要的 可靠性。 也许有用户会说,如今软件系统的故障大大高于硬件,采用容错机的意义不 大。的确,软件故障大于硬件故障,对于软件故障,可以做的是打补丁升级,硬件 无法解决软件的故障。但是对于用户来说,为什么会选择双机冗余,其目的就是克 服硬件故障,从这个意义上说。选择容错机,要远远好于双机冗余方案,除非用户 已经想明白了,其业务系统可以承受一定程度的中断,否则,双机冗余的选择就是 一个绝对的错误。 让“甬温线”事故再也不要发生! 媒体联络 丁涛 美国容错技术有限公司北京代表处 北京市西城区西直门外大街1 号西环广场T3-21 层-B1 电话: 8610 邮箱: joy.ding@ Bee Yiu 美国容错技术(香港)有限公司 香港尖沙咀海港城海洋中心9 楼901 室 电话: 852 邮箱: yiu.bee@ 2 / 2

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档