高可靠集群系统方案白皮书.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高可靠集群系统方案白皮书

高可靠集群系统方案白皮书 1 前言 随着中国加入WTO的 深入和广度,计算机技术被广泛地使用在企事业单位的各个业务环节,越来越多的依赖于计算机技术的应用系统成为我们日常工作的得力伙伴。在给我们带来方便和 效率的同时,也使得各行各业对于计算机技术的依赖程度越来越高。尽管随着计算机技术以日新月异的速度发展,单台计算机的性能和可靠性越来越好,但还是有许 多现实的要求是单台计算机难以满足的。比如以下例子: ???????? 某企业需要一台服务器存储ERP数据。企业运作没有休息的日子,当然也要求支持企业运作的服务器不能有任何理由停机,保证任何时候各个运营点都能访问; ???????? 某企业业务前景看好,但经营者不想马上投入数千万元一台的数据库服务器,而是希望随着业务的扩展,采取逐步增加数据库服务器的方式,逐步升级到具有200GHz计算能力(相当于100颗2GHZ的奔腾4处理器)的数据库服务器来运行数据库管理运算。 ???????? 某电子商务公司在市场策动下突然涌入大量的用户,经营者需要有一种简单方法能够迅速扩充其应用服务器系统,不需要的时候再把扩充的设备去掉。 在这些情况下,往往需要将多台计算机组织起来进行协同工作,模拟一台功能更强大的计算机来解决问题,这种技术称为集群技术(Cluster)。目前应用最为广泛的集群计算技术可以分为三大类:高可靠性集群技术、高性能并行数据库集群技术和高可扩展性集群技术,这三种技术在实际应用中有可能会存在同一个应用中。 2 高可靠性集群技术介绍 2.1 技术概念 高可靠性集群:英文原文为High Availability Cluster, 简称HA Cluster或者HA 高可靠性集群,是指以减少服务中断(宕机)时间为目标的服务器集群技术。高可靠集群主要使用在数据库系统(Oracle、Sybase、SQL Server)以及关键应用系统(Notes、Exchange)中。 随着全球经济的增长,世界各地各种各样的组织对IT系统的依赖都在不断增加,电子化贸易使得商务一周七天24小时不间断的进行成为了可能。电子商务、电子政务成为一种趋势,人们在任何地方、任何时候都可能进行交易和信息查询。不断发展的应用程序使得商业和社会机构对日常操作的计算机化要求达到了空前的依赖程度,如此非常明显的趋势,我们无时无刻不依赖于稳定的计算机系统。 宕机会给企事业造成什么样的麻烦? 直接责任人除了会受到公司严厉的行政处罚,最重要的是关键IT系统的故障可能很快造成整个商务运作的瘫痪,损害企事业的直接利益,每一分钟的宕机都意味着收入、生产和利润的损失,甚至于市场地位的削弱,以及影响长时间积累的良好的市场信誉。 国内企业 年交易额 平均每分钟交易额 制造业 ¥100亿 ¥1.9万 证券业 ¥600亿 ¥100万 零售业 ¥50亿 ¥1.6万 表1 企业每分钟的销售收入统计 ????可用性是指一个系统保持在线并且可供访问。 造成系统宕机的因素很多,包括为了维护而有计划的宕机以及意外故障等,高可靠性方案的目标就是使宕机时间以及故障恢复时间最小化,可以容忍的宕机时间明确的说明方案的全面性、复杂性和成本。 可用性指标 每年宕机时间 级别 99.5 3.7天 Conventional 99.9 8.8小时 Available 99.99 52.6分钟 Highly Available 99.999 5.3分钟 Fault Resilient 99.9999 32秒 Fault Tolerant 表2 国际通用的可用性指标 为了提高整个系统的可用性,除了提高计算机各个部件的可靠性(冗余技术)以外,一般情况下都会采用整机集群的方案。 2.2 工作原理 2.2.1 基本理论 2.2.1.1 高可靠集群的设备组成 所谓集群,就是共同为客户机提供网络资源的一组计算机系统。而其中的每一台提供服务的计算机,我们称之为节点(Node)。当一个节点不可用或者不能处理客户的请求时,该请求将会转到另外的可用节点来处理,而这些对于客户端来说,它根本不必关心这些要使用的资源的具体位置,集群系统会自动完成。 HA高可靠集群在存储方面有两种方式: 1.???????? 共享磁盘,即带存储阵列柜,俗称带柜子 它通过共享盘柜实现集群中各节点的数据共享,从而实现集群的功能。 图1 基于共享磁盘的高可靠集群系统拓扑 2.???????? 磁盘镜像,即不带存储阵列柜,俗称不带柜子 它将集群中的两台服务器的本地硬盘通过数据镜像技术,实现集群中各节点之间的数据同步,从而实现集群的功能。 图2 基于磁盘镜像的高可靠集群系统拓扑 不同的HA软件支持不同的存储方式。 基于共享磁盘的高可靠集群系统中,包含主服务器、从服务器、存储阵列三个主要的设备,以及设备间的心跳连接线。 基于磁

文档评论(0)

shenlan118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档