实时数据仓库技术的分析.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 1 PAGE 1 实时数据仓库技术的分析 实时数据仓库是数据仓库技术的一个新的发展方向。本文研究总结了实时数据仓库的实现技术和体系结构,并重点研究了数据的实时更新技术,在此基础上提出了一种实用性较强的实时数据仓库的实现方法。 1引言 数据仓库经过多年的发展,其技术日趋成熟,在当今信息社会中发挥着重要作用。但在应用中也暴露出一些问题,主要体现在两方面:一:数据的更新问题。首先是缺乏实时性。随着市场竞争的加剧,信息的实时性越来越重要。人们期望没有延迟地获取信息,并据此做出分析和决策。而传统的数据仓库中大多是历史数据,数据抽取周期一般为一天甚至一周。基于传统的数据仓库很难进行实时性处理;其次是数据更新的主动性问题。传统的数据仓库采用周期性的进行批量更新,更新的时间和数据都是既定好的,不管周期是否合适以及数据有无变化。效率低下,缺乏主动性、选择性的更新策略。二:数据仓库的使用范围和应用领域狭窄。传统数据仓库主要为制定企业中长期发展的战略性决策供应支持,服务对象是企业的高层管理者或分析员。而激烈的商业竞争要求数据仓库在供应战略性决策支持的同时,更多的给企业供应关于日常运行的战术性决策支持。而且要扩展数据仓库的使用范围,使中层管理者、操作雇员、甚至合作伙伴和客户都可以访问它,让资源得到充分利用。针对传统数据仓库的以上不足,现在开始提出了实时数据仓库的有关理论和技术。 2实时数据仓库的有关概念和特点 实时数据仓库(ReaI—timeDW)是数据仓库技术的一个新的发展方向。其理论还未成熟,也没有公认的严格定义。本质上实时数据仓库仍旧是数据仓库,它的最大特征是实时性,主要体现在数据仓库中数据的实时性变化上。我们可以这样理解:实时数据仓库是这样一个系统:只要OLTP系统中的事件(如超市中商品的销售行为)完成产生了数据,这些数据就可以马上被实时数据仓库捕获,并变得可用。与传统数据仓库的“快照”形式不同,实时数据仓库中的数据能够同步的反映业务系统(OLTP)中数据的变化,从而准时做出相关分析和决策。明显这特别有利于企业抓住瞬息万变的市场变化,在竞争中处于有利地位。 除了实时数据仓库这一概念外,目前还有一些近似的概念,如动态数据仓库(DynamicDW)、主动数据仓库(Ad-veDW)等。主动数据仓库主要强调了新一代数据仓库中数据更新和决策支持方面的主动性;动态数据仓库则强调数据仓库中数据是动态变化的,与业务数据的变化同步。以上概念都是对新一代数据仓库技术的不同描述,在本质上是近似的。 3实时数据仓库的实现技术研究 要实现实时数据仓库,关键技术在于实现数据的实时更新。根据对反应时间的要求,所谓的实时可以分为真正实时和近似实时两种。这里所说的反应时间是指业务系统中事件的完成时间和该事件的数据在数据仓库中可利用时间之间的延迟。真正实时状况下,反应时间以秒甚至毫秒为单位,可以忽视不计;在近似实时状况下,反应时间是一段时间,以分钟为单位。依据数据实时性要求的不同,可采用不同的更新策略。 (1)以传统的为基础,只是把周期尽量缩短。这并非真正的实时更新技术,只是模拟了实时效果。准实时层借助于ODS实现。业务系统中产生的准实时数据首先采用某种更新策略(如策略4中的事件驱动机制)进入ODS。然后再视详细的实时性要求,以一定的周期从ODS导入准实时层。这一过程可以采用策略2实现,即利用ETL进行增量更新;实时层采用策略5进行更新。由业务系统上的应用程序在产生数据的同时就完成数据的转换和载入,以保证明时性。 这种实现方法对不同实时性要求的数据采用不同的更新策略,数据仓库的三层结构既能够最大限度的满意不同数据的实时性要求,又不会过分增加DW更新的负担、影响系统的性能ODS的引入简化了到DW的数据传输接口,减轻了数据仓库导入数据的负担。另外全部的查询分析和决策都是建立在数据仓库上,这样就有效的解决了基于ODS进行查询分析的数据不全都性问题。在电力营销决策支持系统一泰安项目的开发中,应用这种设计方法取得了良好的效果。据仓库的建模以及基于实时数据仓库的决策支持等方面还没有深入研究,这也是我们下一步的工作方向。

文档评论(0)

186****8296 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档