- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 对于RAC来说,最重要的还是要理解内部原理和体系结构。安装不是非常难的事情。排错和维护都离不开体系结构以及内部原理。 集群分类 1、高性能计算 计算任务分配到不同计算机节点来提高整体计算能力,主要应用在科学计算领域。主要利用的是并行计算。 2、负载均衡集群(LB) 把业务的负载流量尽可能的平均合理的分配到集群的各个节点上,每个节点都可以处理一部分负载,并且可以根据负载情况进行动态的平衡。负载均衡算法不是简单的平均,而是根据每个节点的可用资源或网络的特殊情况来进行优化分配。因此分配+合理才是负载均衡的核心。 3、高可用性(HA) 侧重于提高系统的可用性,集成硬件和软件的容错性来实现整体服务的高可用性。如果某个节点发生故障,另外的节点代替他。 RAC是真正的LB和HA的复合体。从某种意义上说,只有最终应用(数据库)才能实现真正意义上的LB,而绝大多数的集群都是HA。 集群环境的特殊问题 1、并发控制 集群环境中,存在共享存储的问题。集群中各个节点对共享存储是对等的,所有节点对数据有相同的访问权限,因此需要某种机制来控制节点对数据的访问。 在RAC中,采用的是DLM(Distribute Lock Management)机制来进行实例间的并发控制。 2、健忘症(Amnesia) 如果集群环境的配置文件不是集中存放,每个节点都有一个本地副本,集群正常运行的时候,用户可以在任何节点修改集群的配置,并且这些更改都会自动同步到其他节点。 如果节点1因为正常的维护需要关机,节点2修改了配置,然后关闭节点2.启动节点1,因为之前节点2做的配置修改没有同步到节点1,所以将节点1启动以后,他仍然使用旧的配置文件,造成配置丢失。 3、脑裂(split brain) 集群中,节点之间需要通过某种机制(心跳)了解彼此的健康情况,以确保各个节点协调工作。假设只是心跳出现故障,各个节点还在正常的工作,每个节点都认为其他节点宕机,自己是整个集群的唯一健在者,因此需要获得整个集群的“控制权”。存储是共享的,这就意味着灾难,这种情况就是“脑裂”。 投票算法可以解决这个问题 每个节点会在投票区记录自己的票数(自己收到了多少节点的心跳,一个心跳是一票),各个节点会读取其与节点的票数。 如果一个集群分成了两个partition,一个partition是3个节点,一个partition是2个节点。那么3个节点的partition里面所有的节点的票数都是3,两个节点的partition里面所有节点的票数都是2.拥有两个节点的partition会被踢出,自动重启。如果两个partition的节点都相同,那么第一个控制投票区的partiton将会存活,另外一个partition将会被踢出而重启,这种情况通常是master节点(一般是第一个启动的节点)所在的partition将会存活。 4、IO隔离(IO Fencing)、 集群出现故障,必须判断哪个节点应该获得集群的控制权,那些节点需要被踢出。这时投票需要解决的问题。 仅仅将他们踢出还不足够,因为他们可能还在继续运行(只是离开了这个集群),需要保证他们不再访问共享数据。这就是IO隔离要解决的问题。 IO Fencing实现有硬件和软件方式。各个集群厂商使用的方式不同,有些需要硬件的支持(主要是存储设备是否支持某些协议)。Oracle RAC使用的是软件的 方式,直接重启故障节点。 无论采用哪种方式,IO Fencing的目的就是保证故障节点不能继续访问共享数据。 有一些存储设备支持SCSI Reserve/Release命令,正常节点使用SCSI Reserve命令锁住存储设备,故障节点发现存储被锁定,就知道自己已经被踢出了cluster,自行重启,这种机制叫做自杀机制(suicide)。例如Sun和Veritas的集群使用的就是这种机制。 无论软件还是硬件,大致原理就是:正常节点通过某种方式告知故障节点,故障节点会进行重启。告知的方式有硬件和软件之分,硬件更加安全一些。 RAC集群 2001年发布了Oracle 9i,其中就有RAC。 RAC是在OPS(Oracle 6开始发布)的基础上发展起来的,OPS是最初的集群产品,但是OPS的集群性能还是很差的,这和他的工作机制有关系。 应用程序Oracle 集群管理软件 操作系统Linux 应用程序Oracle 集群管理软件 操作系统Linux Public网络 Private网络 共享存储 节点 节点 存储层 RAC是一个多实例、单数据库的系统。数据文件、联机日志文件、控制文件等存储在共享存储上。经常使用的存储:例如EMC、NETAPP、IBM、HP等。 每个服务器通过HBA卡和光纤线连接到存储上。 实例指的是SGA和Background Process组成的运行时环
您可能关注的文档
最近下载
- 2014日产玛驰全车电路图维修手册51-仪表和警告灯.pdf VIP
- 软件公司质量手册(含程序文件).doc VIP
- 城市总体规划编制标准.pdf VIP
- 电力系统英文书籍推荐.docx
- Unit 1 Happy Holiday 第5课时(Section B 2a-3c)课件 -2025-2026学年人教版英语八年级上册.pptx VIP
- 一种基于TTE总线的运载火箭全数字互联系统.pdf VIP
- 新译林版英语六年级下册全册教案GG.doc VIP
- 美容心理学概述PPT(完整版)课件.pptx VIP
- 第三章 无土栽培的理论基础.ppt VIP
- 企业管理手册××软件公司质量手册.pdf VIP
文档评论(0)