? ? ? ?
? ? ?
主机 HA 高可用技术梳理和最佳实践
? ? ?
?
?
?
?
? ? ?
? ? ?
?
? ? ?
?
?
?
本文主要介绍主机高可用方案、实施和维护的经验教训等,希望对这些知识点的梳理,为运维和管理人员在选择相应产品时提供借鉴和参考。包括:
1、什么是主机高可用
2、主机高可用主流解决方案
3、主机HA能做什么
4、主机HA高可用定义和切换流程
5、HA三种经典工作方式
6、主机HA的核心组件和实现原理
7、哪些场景不适合主机HA
8、主机HA高可用选择参考
9、Oracle高可用场景的解决方案探讨分享
1、什么是主机高可用
高可用性H.A.(High Availability)指的是通过尽量缩短因日常维护操作(计划)和突发的系统崩溃(非计划)所导致的停机时间,以提高系统和应用的可用性。它与被认为是不间断操作的容错技术有所不同。HA系统是目前企业防止核心计算机系统因故障停机的最有效手段。
随着IT信息系统的不断发展,数据在企业的应用越来越广,如何提高IT系统的高可用性成为建设稳健的计算机系统的首要任务之一。构成计算机网络系统的三大要素是:网络系统,服务器系统,存储系统。网络系统包括防火墙,路由器等网络设备,服务器系统主要指用户使用的各种服务器系统,存储系统,则是用户最主要的数据存储放的地点。
因此IT系统的高可用建设应包括网络设备高可用性,服务器设备高可用性,及存储设备的高可用性三个方面。
今天在这里我们主要来聊聊主机高可用解决方案,主机高可用主要使用服务器集群和高可用软件来实现。目前市场上主流的主机HA解决方案产品有:IBM PowerHA,HP的SG,RedHAT的RHCS ,SUSE HA,ROSEHA,赛门铁克VCS,LanderCluster 等。
希望通过本篇小文可以让大家了解什么是主机HA,目前主流HA产品有哪些,主机HA应该由哪些核心组成,能够做到那些方面的高可用,在实施和维护方面有哪些经验和教训以及希望主机HA能够在那些方面加强和新需求等等。希望对这些知识点的梳理,让运维和管理人员在选择相应产品时可以有一个借鉴和参考,给大家尽一点微薄之力。
2、主机高可用主流解决方案
接触过基础平台的工作人员应该对主机高可用解决方案不陌生,因为主机的高可用解决方案主要是通过集群或者高可用软件来完成的。目前市场上常见的HA架构的软件有以下几种:
微软MSCS
虚拟化平台HA(如VMWARE)
IBM的PowerHA
惠普的SG(Service Guard)
红帽的RHCS
Novell的SUSE HA
ROSE HA
赛门铁克VCS
Landercluster
Fujitsu PRIMECLUSTER
F5
……
主机HA 软件有很多,有大厂商也有小公司,每个软件的都有相应的应用场景和局限性,目前还没有那款软件可以通吃所有的平台,这可能跟研发能力和成本以及后续的更新有很大关系。往往软件做的小巧灵活,稳定性高反而更加有市场,比如linux的lvs ,操作系统自带集成在,软件很小,效果非常的不错。
3、主机HA 能做什么
主机HA并不是万能的,每个产品可能都适合几种类型的场景。记得第一次接触PowerHA的时候,感觉这个软件应该具备很多功能,基本上你能想象的功能它应该都具备,但实际上它能检测几项故障类型:
节点失效
网卡失效
网络失效
应用异常
对于应用监控配置,PowerHA 少有人去配置或配置的好,有很多因素。
主机HA软件是各有所长,希望主机HA软件做的及稳定又效率,让工作更加容易。
小技巧:
实施人员的水平基本上决了主机HA的架构的健壮性,选择有经验的实施人员有时候比选择软件本身更重要。
以前第一次接触SUSE HA,然后就用PowerHA的工作方式去理解,因为都是HA软件工作的方式应该差不多,当时我问了实施人员一个问题(主备模式,没有网卡聚合),如果主节点第一块网关故障了,服务IP如何切换? 工程师说:切换到另外一个主机上啊,很正常啊。
相比较而言,PowerHA在这一块还是做的不错的,如果服务ip在网卡1上,这时网卡1故障了,ip会切换到网卡2上,而不进行资源切换到备份节点,当然也可以通过网卡聚合,保证网卡1故障了,不切换资源,但是毕竟增加了投入。
这里贴一个PowerHA 使用IP 地址切换方式(别名方式)
4、主机HA高可用定义和切换流程
高可用性 (High Available), 是通过系统的可靠性(reliability)和可维护性(maintainability)来度量的。通常用平均无故障时间(MTTF)来度量系统的可靠性,用平均维修时间(MTTR)来度量系统的可维护性。故:HA=MTTF/(MTTF+MTTR)*100%
具体HA衡量标准:
99% 一年宕机时间
原创力文档

文档评论(0)