[HA和集群的概念.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[HA和集群的概念

1.1 什么是集群 简单的说集群cluster就是一组计算机它们作为一个整体向用户提供一组网络资源。这些单个的计算机系统就是集群的节点node。一个理想的集群是用户从来不会意识到集群系统底层的节点在他/她们看来集群是一个系统而非多个计算机系统。并且集群系统的管理员可以随意增加和删改集群系统的节点。 1.2 集群系统的主要优点 1高可扩展性 2高可用性HA集群中的一个节点失效它的任务可传递给其他节点。可以有效防止单点失效。 3高性能负载平衡集群允许系统同时接入更多的用户。 4高性价比可以采用廉价的符合工业标准的硬件构造高性能的系统。 2.1 集群系统的分类 虽然根据集群系统的不同特征可以有多种分类方法但是一般把集群系统分为两类 1、高可用High Availability集群简称HA集群。 这类集群致力于提供高度可靠的服务。就是利用集群系统的容错性对外提供724小时不间断的服务如高可用的文件服务器、数据库服务等关键应用。 负载均衡集群使任务可以在集群中尽可能平均地分摊不同的计算机进行处理充分利用集群的处理能力提高对任务的处理效率。 在实际应用中这几种集群类型可能会混合使用以提供更加高效稳定的服务。如在一个使用的网络流量负载均衡集群中就会包含高可用的网络文件系统、高可用的网络服务。 2、性能计算High Perfermance Computing集群简称HPC集群也称为科学计算集群。 在这种集群上运行的是专门开发的并行应用程序它可以把一个问题的数据分布到多台的计算机上利用这些计算机的共同资源来完成计算任务从而可以解决单机不能胜任的工作如问题规模太大单机计算速度太慢。 这类集群致力于提供单个计算机所不能提供的强大的计算能力。如天气预报、石油勘探与油藏模拟、分子模拟、生物计算等。 3.1 什么是高可用性 HA 计算机系统的可靠性用平均无故障时间MTTF来度量即计算机系统平均能够正常运行多长时间才发生一次故障。系统的可靠性越高平均无故障时间越长。可维护性用平均维修时间MTTR来度量即系统发生故障后维修和重新恢复正常运行平均花费的时间。系统的可维护性越好平均维修时间越短。计算机系统的可用性定义为MTTF/MTTFMTTR 100。由此可见计算机系统的可用性定义为系统保持正常运行时间的百分比。 计算机产业界通常用如下表所示的9的个数来划分计算机系统可用性的类型。 可用性分类 可用水平 每年停机时间 容错可用性 999999 1 min 极高可用性 99999 5 min 具有故障自动恢复能力的可用性 9999 53 min 高可用性 999 8.8 h 商品可用性 99 43.8h 负载均衡服务器的高可用性 为了屏蔽负载均衡服务器的失效需要建立一个备份机。主服务器和备份机上都运行High Availability监控程序通过传送诸如“I am alive”这样的信息来监控对方的运行状况。当备份机不能在一定的时间内收到这样的信息时它就接管主服务器的服务IP并继续提供服务当备份管理器又从主管理器收到“I am alive”这样的信息是它就释放服务IP地址这样的主管理器就开开始再次进行集群管理的工作了。为在主服务器失效的情况下系统能正常工作我们在主、备份机之间实现负载集群系统配置信息的同步与备份保持二者系统的基本一致。 HA的容错备援运作过程 自动侦测Auto-Detect阶段由主机上的软件通过冗余侦测线经由复杂的监听程序。逻辑判断来相互侦测对方运行的情况所检查的项目有主机硬件CPU和周边、主机网络、主机操作系统、数据库引擎及其它应用程序、主机与磁盘阵列连线。为确保侦测的正确性而防止错误的判断可设定安全侦测时间包括侦测时间间隔侦测次数以调整安全系数并且由主机的冗余通信连线将所汇集的讯息记录下来以供维护参考。 自动切换Auto-Switch阶段 某一主机如果确认对方故障则正常主机除继续进行原来的任务还将依据各种容错备援模式接管预先设定的备援作业程序并进行后续的程序及服务。 自动恢复Auto-Recovery阶段在正常主机代替故障主机工作后故障主机可离线进行修复工作。在故障主机修复后透过冗余通讯线与原正常主机连线自动切换回修复完成的主机上。整个回复过程完成由EDI-HA自动完成亦可依据预先配置选择回复动作为半自动或不回复。 3.2、HA三种工作方式 1、主从方式 非对称方式 工作原理主机工作备机处于监控准备状况当主机宕机时备机接管主机的一切工作待主机恢复正常后按使用者的设定以自动或手动方式将服务切换到主机上运行数据的一致性通过共享存储系统解决。 2、双机双工方式互备互援 工作原理两台主机同时运行各自的服务工作且相互监测情况当任一台主机宕机时另一台主机立即接管它的一切工作保证工作实时应用服务系统的关键数据存放在共享存储系统中。 3、集群工作方式多服务器

文档评论(0)

lisufan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档