SunCluster工作原理介绍.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Sun Cluster工作原理介绍 本章的结构安排是以介绍Sun Cluster中重耍的概念为主线。相关的工作原理分布在各个 概念的介绍之中。 quorum的概念在分布式系统中经常被用到。原本的概念上,quorum是在具冇竞争关系 的关键时刻时一个多数成员达成的一致意见,从而得岀最好的解决方案。这里可以理解为 多数人达成一致的意见的一种机制,或者达成一致意见的这些多数成员。组成可被接收的 quorum的实际数量在不同的情况下也不同。或许要求2/3,或许只耍超过50%即可。 在分布式计算机系统中,一组有通讯关系的进程由quorum的潜在成员组成。为保证系统 有效运行以及对系统行为作出关键决策,该组进程通过交互信息以在一些关键问题上达成 一?致,玄到quorum的最终形成。 在Sun Cluster中,有两种类型的quorum被使用: 群集成员关系监视器CMM (Cluster Membership Monitor)需要获取关于一组群集节点 列表的quorum,这些节点具有成为Cluster成员的能力。编者注:这个意思就是CMM 需要在具冇Cluster节点关系的一组节点中得到一个多数人的同意。所以quorum: “多数 人的同意”中的这个“人”的主体并不具体代表是什么东西,仅仅是表明这些东西形成多数同 意的关系,那这里肯定是指节点了。这种类型的quorum被称为CMM quorum ,或Cluster quorum。 Cluster 配置数据库 CCD (Cluster Configuration Database)需要获得 quorum ,以 挑选出一个冇效一致的CCD拷贝。这里的主体就是CCD To CMM quorum Cluster2.2中,如果使用SSVM或CVM, quorum由Cluster的框架软件决定,如果使 用disksuite作为卷管理器,则quorum由disksuite來决定。 CMM quorum这样被决足: X如果使用SSVM和CVM作为卷管理器,quorum是在多个具有投票权利的节点和其他 的小性设备上达成的多数通过意见。在两节点中,为了产生quorum,—个quorum device 提供一个投票的第三方。注意:quorum device和quorum是两个概念。quorum device 的概念在后面讲到。 入用disksuite作为卷管理器,就不讨论了。 当节点加入、离开Cluster时和Cluster Z间的私网连接失败的情况下形成quorum是非 常必要的。Cluster2.x努力达到在不耍人为干预的情况下,既保证了数据的完整性,也维 系Cluster的可川性,所以就使川到了 quorum device。在多节点中,甚至用到了 TC。 Cluster 2.2在Cluster心跳连接失败的情况下决定quorum时,卷管理器起到了主要的 因素作用。心跳失败的具体情况请参见后面quorum device章节内容。 CCD quorum 群集配置数据库CCD (Cluster Configuration Database)需要获得quorum ,以挑选 出一个有效一致的CCD拷贝。有关CCD的内容参考厉面的相关章节。 CCD屮保存了 Cluster的配置信息。CCD在每个Cluster节点上都冇一个,正常情况下, 各节点的CCD间应该是保持同步的。CCD间的通信通过私网连接。但山于故障后,可能 会导致各CCD不能报错同步,这时就需耍用到CCD quorum 了。 一个有效的CCD在故障恢复后必须被决定出來,如果一?个有效的CCD不能够被决定出來, 所有对于CCD的查询和更新操作随着一个CCD错误的告警而失败。 在决定有效CCD拷贝Z前需要启动所何节点是一个非常受限制的条件。可以通过对更新操 作作一个强制限制來使该限制放松。 如果n是当前Cluster中配置的节点数,对于Cluster重启时,有ceiling (n)个同样的 拷贝就足以选出一个有效的CCD拷贝。当n为奇数时,ceiling (n) = (n + 1 ) /2;当n 为偶数时,ceiling (n) = (n/2)。对于一个节点,拷贝数为1个时足够;对于2个节点 时,1个拷贝足够;对于3个节点时,2个拷贝足够;对于4个节点,2个拷贝足够。所以 该ceiling (n)可以理解为人于等于n的一半的最人整数。有效的CCD将被知会到所有没 有最新CCD的节点中去。注意:即使CCD是无效的,一个节点依旧被允许加入到Cluster 中。但是,在这种悄况下,CCD既不能被更新也不能被查询(检验:一个节点启动时,是 否冇查询CCD的打印消息)。这就意味着所有依赖CCD的Cluster的组件处丁?功能失常 状态。特别的,在这种情况下,逻辑主机不能

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档