数据处理平台高可靠性的设计与实现.docVIP

数据处理平台高可靠性的设计与实现.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据处理平台高可靠性的设计与实现 数据处理平台高可靠性的设计与实现 中国建设银行股份有限公司信息技术管理部厦门开发中心林华兵 在多个业务处理系统的应用环境中,一般都会涉及 数据整合与数据集中处理的环节,通常在IT架构上会在 多个上下游系统之间搭建一个数据处理平台,用于处理 业务系统与下游的信息管理系统之问的数据加工需求, 这个系统会根据需要进行短期的数据存储.对涉及多业 务系统的企业,如银行,电信等,数据处理平台面对的 源和目标系统多,每日处理数据量都很大.同时,为了 适应管理与业务运营的需要,目标系统对供数的时间要 求严格,数据处理平台必须在规定的时间窗口内准确地 完成数据的转换和传输,以便支持下游系统正常运行, 在这种环境下,数据处理平台的高可靠性(HA,High Availability)具有至关重要的意义. 一 ,数据架构平台分析 以某大型国有银行为例,业务方面日常运行着贷 款,信用卡,数据仓库等多种应用,系统环境相对较 复杂,数据处理平台面对的源和目标系统数量超过f) 个,每日数据处理量达~I]TB级.相应地,目标系统对 数据处理的时间要求严格,若在规定的时间窗口内数据 未到达将直接影响次日的系统运营.为满足应用的需 求,该银行搭建了一个位于数据仓库前端的操作型数据 存储平台,实现每日业务系统到下游系统的数据加工, 并根据加工要求进行特定数据的短期存储.其主要功能 结构如图1所示. 图l中的各主要功能模块和数据存储层均有交互, 而相互间则通过事件通信和数据通信建立联系,是一种 基于消息和数据依赖的低耦合的架构.在物理分布上, 各个功能模块也是相互独立的,并支持通过存储共享的 38中国金融电脑/2010.11 图1数据存储平台功能结构 方式实现加工的横向扩展.基于数据处理的高可靠性需 求,结合我们的实践经验,本文从平台的分析和设计层 面入手,提出一种可行的数据处理平台的高可靠性实现 方法. 从容错角度看,系统可靠性实现手段包括硬件冗 余,软件冗余,信息冗佘和时问冗佘,而从容灾或故障 自动恢复的角度看,系统可靠性还包括有效的故障检测 和预警,发生故障时能自动或半自动地进行服务的重启 或平滑切换到备份的模块中.简而言之,实现数据处理 平台高可靠性的基本条件如下: (1)物理上,各模块所在的服务器具有备份机器; (2)具备故障汇报或心跳检测机制; (3)模块低耦合,模块故障可通过恢复脚本或程 序独立恢复; (4)错误发生时业务可以正确回退,应用可以通 过重新调度运行先前的任务. 在企业级系统架构中,为有效支持可靠性的实现, 除了满足功能需求外,在系统分析和软件设计阶段就必 须引入指标考量备功能模块的耦合度以及横向扩展性, 业务逻辑中断后的可持续性,区分系统可实现的可靠性 功能和应用实现的可靠性功能,同时在硬件资源方面争 取到合理的冗余以便支撑可靠性的实施. 在综合考虑了数据量和加工效率的基础上,该银行 的数据处理平台被设计为分布式的体系结构,各主要功能 模块相互独立,这为高可靠性奠定了逻辑基础.而主要 功能在物理部署上同样是分开的,并为各模块提供了备 份机器,这种部署则是高可靠性实现的物理基础,同时 这种分布还可以确保将故障缩小到易于控制的范围中. 二,架构的实现方法 考虑到该数据处理平台业务量持续增长的实际情 况,在设计了低耦合的逻辑结构和相互备份的物结构 后,在系统和数据库层面,我们提出以下策略以支持高 可靠性的实施:一是数据容灾和应用容灾相结合.该数 据处理平台是基于Oracle10g数据库的批处理系统,在 数据库级,系统采用定期在线增量备份和日志归档的策 略进行重要业务数据的备份,同时,为备份数据在异地 建立镜像,防止重大故障或灾难出现时本地备份失效. 在应用方面,则更多地通过削减模块功能依赖,增加备 份部署与故障检测等手段确保高可靠性.二是系统级 HA和应用级HA相结合.对于和外围系统关联的模块, 如文件接入服务,因传输时IP地址配置为绑定的方式, 我们采取系统级HA确保某一接入服务器故障时其IP地 址能被备份机器复用,确保该切换对外围系统的透明. 此外,采用系统HA的还有Oracle数据库服务,在数据文 件未被破坏的情况下,该HA可以确保某一数据库服务 失效时可以及时切换到备份的数据库副本上. 结合系统和数据库层面的可靠性策略,而在数据处 理平台的应用层面,我们进一步采片j以下结构和方法, 从业务的细粒度层面确保平台的可靠性. 1.分布式模块设计,粗粒度松耦合 该数据处理平台的各个主要模块,包括事件通汛, 作业调度,作业运行,数据传输等在功能上是相互独立 的,仅存在数据或消息耦合,当某个功能模块发生故 障时,其他模块的流程仍可持续;而在实际的物理部署 上,由于处理量大,各模块也采用了分布部署的模式, 可充分降低故

文档评论(0)

xieliandimei + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档