- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
NEC EXPRESSCLUSTER-APP一对一镜像高可用方案
双机热备方案
XXXXXXXXXXXXXXXXXXXXX
XXXX-XX-XX
目录
TOC \o 1-3 \h \z \u HYPERLINK \l _Toc332017716 1 项目背景 2
HYPERLINK \l _Toc332017717 2 集群系统介绍 2
HYPERLINK \l _Toc332017718 3 需求分析 8
HYPERLINK \l _Toc332017719 4 解决方案 PAGEREF _Toc332017719 \h 9
HYPERLINK \l _Toc332017720 5 产品报价 PAGEREF _Toc332017720 \h 11
HYPERLINK \l _Toc332017721 6 EXPRESSCLUSTER的特点及技术优势 PAGEREF _Toc332017721 \h 12
HYPERLINK \l _Toc332017722 6.1 故障侦测机制的强化 PAGEREF _Toc332017722 \h 12
HYPERLINK \l _Toc332017723 6.2 数据库监视选件(Database僵死状态杀手) PAGEREF _Toc332017723 \h 13
HYPERLINK \l _Toc332017724 6.3 适用平台范围的扩大 PAGEREF _Toc332017724 \h 14
HYPERLINK \l _Toc332017725 6.4 提供异地灾备方案 PAGEREF _Toc332017725 \h 15
HYPERLINK \l _Toc332017726 6.5 简便的维护操作 PAGEREF _Toc332017726 \h 15
HYPERLINK \l _Toc332017727 6.6 简便易用的集群配置工具 PAGEREF _Toc332017727 \h 16
项目背景
随着公司业务规模的不断扩大和数据量的不断攀升,公司现有的系统架构已经不能保证业务系统的安全有效的持续运行。业务的增加就意味着增加对支持业务系统的负载,任意故障对业务系统造成的中断都将造成一定的损失。当业务系统出现故障需要恢复时,依靠原有的人工修复可能需要很长的时间完成。为此,给公司带来了经济损失的同时也将会失去客户的信任。
集群系统介绍
HA (High Availability)集群
一般提升系统可用性时,会认为对构成系统的组件进行冗余化,消除Single Point of Failure 是重要的。所谓Single Point of Failure 指的是计算机的构成要素(硬件的组件)因为只有一个,所以该处发生故障时会有使业务停止的弱点。???谓HA 集群是使用多台节点进行冗余化操作、将系统停止时间控制在最小限度,提升业务可用性(availability)的集群系统。
某些骨干业务系统等的宕机会给业务带来很大影响,因此此类系统不允许停止,需要导入HA 集群。
图 2-1 HA 集群构成图
HA 集群可分为共享磁盘型和镜像磁盘型。以下开始逐一进行说明。
共享磁盘型
集群系统中服务器间必须要交接数据。将这些数据从多个服务器放到象以SAN 连接的FibreChannel 磁盘阵列装置这样可以访问的外置磁盘(共享磁盘)上,通过该磁盘在服务器间交接数据即称为共享磁盘型集群系统。
运行业务应用程序的服务器(当前服务器)发生故障时,集群系统查出故障并在交接业务的服务器(待机服务器)中自动运行业务应用程序,交接业务。这称为失效切换。集群系统交接的业务由磁盘、IP 地址、应用程序等资源构成。
在没有集群化的系统中使用其它服务器重启应用程序时,客户端必须再次连接不同的IP 地址。但是多数的集群系统里不是以业务为单位给服务器分配IP,而是分配其他网络的IP地址(虚拟IP 地址)。因此客户端没必要去区分正在执行业务的是当前服务器还是待机服务器,如同连接同一个服务器一样,可以持续的运行业务。
由于当前服务器宕机发生失效切换时,共享磁盘上的数据没有进行妥当的结束处理就交接给待机服务器。因此待机服务器中有必要对交接的数据进行逻辑检查。这与一般未集群化的系统宕机后重启时进行的处理是一样的。例如,如果是数据库就需要回滚及前滚的处理。由此客户端仅运行未提交的SQL 文就可以继续业务。
故障发生后,被查出故障的服务器经过物理隔离修复后、只要连接集群系统就可以作为待机服务器恢复运行。重视业务连续性的实际操
文档评论(0)