网站大量收购闲置独家精品文档,联系QQ:2885784924

跨机房部署or多集群容灾?架构师热议:金融行业如何选择信创数据库容灾方案?.docx

跨机房部署or多集群容灾?架构师热议:金融行业如何选择信创数据库容灾方案?.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

跨机房部署or多集群容灾?架构师热议:金融行业如何选择信创数据库容灾方案?

背景:

信创数据库容灾建设有诸多需求难点:如具有技术兼容性、复杂的数据同步机制、快速切换与恢复能力、成本考量等等,多集群部署与跨机房部署哪一种容灾方式是最优解?本文来自社区金融行业架构师和资深工程师同行结合真实案例进行的投票和观点分享,分析了选择原因和不同方案的利弊,希望能够为即将或正在进行信创数据库容灾建设的同行提供参考价值。

一、信创数据库容灾建设的难点

信创数据库的容灾是指为保证业务连续性和数据安全性,对国产化数据库系统采取的一系列预防措施和技术手段。以下是信创数据库容灾的几个主要难点:

技术兼容性:信创环境通常使用的是国内自主研发的基础软硬件设施,这些设施与国际主流产品可能存在一定程度的技术差异或兼容问题。因此,在构建跨平台、多系统的容灾方案时需要考虑如何解决不同技术体系之间的兼容性和互操作性问题。

成本考量:建立一套完整的容灾体系不仅要投入大量的资金购买相应的硬件设备和软件许可,还需要考虑到后续运维过程中持续的人力物力开销,不同的容灾架构所需成本差异很大。对于许多企业而言,如何平衡容灾需求与预算限制是一大难题。

复杂的数据同步机制:为了保证主备数据中心之间数据的一致性,通常需要实现高效稳定的数据同步功能。然而,在实际操作中,由于网络延迟、带宽限制等因素的影响,很难做到完全实时的数据复制,这就要求设计出既能满足性能要求又能保障数据一致性的解决方案。

快速切换与恢复能力:一旦发生故障,能否快速准确地将服务从原生产环境切换至备用环境中,并且能够在最短时间内恢复正常运营状态,是衡量容灾效果好坏的重要指标之一。特别是金融行业,往往要求极高的系统可用性和快速的恢复时间目标(RTO)以及恢复点目标(RPO),确保在灾难发生后也能迅速恢复正常运营。这增加了容灾解决方案的技术复杂度和成本,也考验着整个架构的设计水平和运维团队应对突发状况的能力。

二、多集群部署和跨机房部署——数据库的两种容灾方式

(一)多集群部署

通过实施多集群部署容灾方案,可以将数据库集群部署两套或者多套。当主集群发生故障时,理想状态下,备集群能够数据无损地快速完成切换,替代主集群继续提供生产服务。

多集群部署可以实现集群隔离。数据库集群间解耦,故障域隔离从而避免全局性的故障;集群间版本隔离,可避免Bug污染,能够快速回切;方便数据库管理员对数据库系统资源使用进行规范和约束。

(二)跨机房部署:

跨机房部署需要在架构上进行良好的设计。跨机房最大的挑战在于机房之间的物理距离远,异地数据传输的延迟难以忽略。在网络普遍延迟的情况下,如何根据业务特性设计高可用的性能达标的分布式系统,将是最为关注的问题之一。

三、社区投票:跨机房部署or多集群容灾——金融行业如何选择信创数据库容灾方案?

twt社区针对跨机房部署和多集群容灾两种数据库容灾方式,组织架构师和资深工程师同行,结合真实案例进行了选择投票和观点分享,分析了选择原因和不同方案的利弊,希望能够为即将或正在进行信创数据库容灾建设的同行提供参考价值。投票结果如下所示:

四、同行热议观点分享

姚雅飞某商业银行资深工程师

立场:多集群容灾

观点:

1、技术原因:目前信创数据库不管是双机热备部署还是集群部署,厂商的设计目标一般满足数据库自身稳定运行,主要用于单数据中心内解决高可用的问题。在实际实施时考虑到双中心部署是原理上可行,但设计上由于厂商考虑满足数据库稳定运行,在外部参数的要求上比较苛刻,跨机房部署代价高、稳定性差。多集群方案本质上是两套独立的运行环境,中间通过数据库日志回放等技术完成数据同步,对单集群稳定运行基本没有影响。跨机房部署技术复杂度高,出现问题在短时间内解决困难,多集群部署在出现问题时排查步骤相对简单,干扰因素少。

2、增加了业务连续性风险:容灾最终要解决的是一些极端场景下的业务不间断,发生的频率相对较少。跨机房部署增加了网络稳定性、延时等第三方带来的不确定性,数据库日常的稳定运行不能保证,认为增加了运行风险,带来业务的不稳定。多集群部署都是独立运行的集群,互相之间几乎没有干扰,对于原来的数据库仅是把事务日志发出一份给对方,稳定性几乎不受影响。

董生某大型银行数据库架构师

立场:跨机房部署

观点:

个人比较倾向于跨机房部署,减少单机房故障的时候出现数据库系统的不可用情况。以笔者的了解和经验,目前大部分数据库在灾备建设时,采用的是多地多集群的部署模式,单个集群集中部署在一个机房内部。这样的好处是当灾备发生的时候,可以快速的切换到其他区域的集群承载业务。

但是还有一个情况,数据库在灾备建设时,一般会根据自己系统的等级,选择合适的灾备策略。对于很多较低的系统,建设时大部分只有一个异地数据文件的冷备。若生产的数据库都存在于一个机房,发生意外事故时

文档评论(0)

150****5147 + 关注
实名认证
内容提供者

二级建造师持证人

分享知识,传播快乐!

领域认证该用户于2024年03月19日上传了二级建造师

1亿VIP精品文档

相关文档