HACMP高可用集群多处理.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
HACMP高可用集群多处理

4.5 HACMP 5.1 高可用集群多处理 HACMP 5.1 可针对基于数据库的应用提供高可用子服务,系统为集群中的每台机器提供系统管理、配置的完整性及控制,以及故障接管和恢复。 HACMP 5.1 是一个软件产品,用于监测硬盘、硬盘适配卡、网络、网卡和处理器(服务器),以及这些部件的故障恢复。一个松散耦合的处理器或节点集群,在HACMP 5.1软件的配合下,可以通过将控制从一个已发生故障的处理器(服务器)转移到具有冗余能力的备份处理器上,来保持应用的可用性。 HACMP 5.1产品在支持广泛的集群配置和处理不同的出错类型方面具有极大的灵活性:HACMP可以支持多至32个节点(即:32台服务器)的集群,允许同时存取或非同时存取的配置。 HACMP 5.1可以支持整个RS/6000服务器产品系列。这样,集群系统就无须限定在对称式配置上,支持较低成本的备份机配置,其性能未必要匹配生产机,以便节省投资。对有些部件的故障,如ATM网卡,则根本无需由另一节点进行出错接管。HACMP能够监测和恢复在一个主机内部的错误。由于部件的切换时间比处理器的切换时间更短,因此,停机的时间进一步缩短。 HACMP 5.1提供一系列安装和配置工具,使用户可以从一个节点上对整个RS/6000处理器集群进行配置,比逐一配置更为简单。此外,HACMP还提供一组综合的,数据驱动的出错接管文本程序(script),使得集群的管理和配置工作更容易。 HACMP的工作原理是利用LAN来监控主机及网络、网卡的状态。在一个HACMP环境中有TCP/IP网络和非TCP/IP网络。TCP/IP网络即client访问的公共网,该网可以是大多数AIX所支持的网络,如Ethernet,T.R.,FDDI,ATM,SOCC,SLIP,等等。 每个节点上都有至少两块网卡,一块是service adapter,提供对外服务,另一块是standby adapter,它的存在只有clusterManager知道,应用和client并不知道。非TCP/IP网络用来为HACMP对cluster中的各节点进行监控而提供的一个替代TCP/IP的通讯路径,它可以是用RS232将各节点连接起来,也可以是将各节点的SCSI卡或SSA卡设置成TargetMode方式。为了简单方便,一般采用RS232串口连接的方式,这也是绝大多数用户采用的方式。 HACMP故障类型: HACMP将诊测并响应于三种类型的故障:网卡故障,网络故障,节点故障。下面就这三种故障分别进行介绍。 网卡故障 前面讲到,HACMP的群集结构中,除了TCP/IP网络以外,还有一个非TCP/IP网络,一般为RS232连接,它实际上是一根心跳线,专用来诊测是节点死机还是仅仅网络发生故障。一旦节点加入了cluster(即该节点上的HACMP已正常运行),该节点上的各个网卡、RS232串口和Target-ModeSSA或SCSI就会不断地接收并发送 Keep-Alive信号包,K-A的参数是可调的,针对以太网,当处于normal状态时,将每隔0.5秒发送一个K-A包,如果12个包丢失后HACMP确认对方网卡、或网络、或单点发生故障。因此,有了K-A后,HACMP可以很轻易地发现网卡故障,因为一旦某块网卡发生故障,发往该块网卡的K-A就会丢失。此时nodeA上的cluster manager(HACMP的大脑)会产生一个swap-adapter的事件,cluster manager将原来的service adapter的IP地址转移到standby adapter上,同时网上其他节点进行ARP的刷新。网卡互换(swap-adapter)通常在几秒内就可完成,以太网为3秒,并且这种转换对应用和client来说是透明的,只发生延迟但连接并不中断。 网络故障 如果发往nodeA上的service和standby网卡上的K-A包全都丢失,而RS232上的K-A仍然存在,那么HACMP断定nodeA仍然正常,是网络发生故障。此时HACMP执行一个network-down的事件的script,通常这个script提供一个用户自行定义其行为的接口,用户可以根据自己的网络结构,用户数,是否有替代路径,使用的通讯软件,应用软件 等来自行设计网络发生故障后应采取的行为。 节点故障 如果不仅网络上的K-A全部丢失,而且RS232上的K-A也丢失,那么HACMP断定该节点发生故障,一个node-down事件发生。此时将有资源的接管发生,即放在共享磁盘阵列上的资源将由备份节点接管,接管包括一系列操作:Aquiredisks,Varyon VG, Mount file systems,Export NFS file systems,Assume IP network Add

文档评论(0)

sunshaoying + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档