oltp与数据r仓库差异.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
OLTP 与数据仓库--有何差异?在日常生活中,我们要使用大量的应用程序来生成新的数据、变更数据、删除数据,当然在大多数的情况下我们还要查阅和分析数据。就来想象一个 收发 email 的简单应用程序吧。我们已经存储了地址信息,可能还存储了一些文档。我们可以决定是否存储已经发送过的邮件,但是也可能隔一段时间后将其删除,或者删除已 经发送过的所有邮件。那么我们该如何处理一段时间以前删除或者修改过的地址呢?我们再也不会看到它们了。Email 程序大部分都属于不是很复杂的数据库,但是完全可以将其看作一个在单用户环境下的 OLTP(在线事务处理系统)简单示例。它使用了所有的所谓访问数据的操作 CRUD(创建、读取、更新、删除)。当数据存储达到一定量的时候,规模就会几乎保持不变,因为可以从存储中删除过期数据。数据仓库就完全是一种不同种类的应用程序。它并不是用来运行当前的操作,例如发送邮件。它是用来分析数据并且从现有数据中发现新的价值,主要是用来预测未来的情况。数据仓库并不是解决所有问题的通用结构。它必须集中于某一问题领域,例如航空服务、顾客收益等。数据仓库也有有趣的一面,那就是数据库本身是稳定增长的。数据没有被删除,也不发生变更。我们不需要将冗余数据置于数据库之外(因为加入仓库中的数据经过了数据净化的过程,该过程检查了数据的正确性)来减少复杂性同时增强读取操作的性能。为了能够对数据仓库中的数据进行分析,数据存储于一个多维结构中,叫做星型模式。如果将星型模式扩展,就会得到雪花模式。本白皮书将会阐述如何使用IBM Rational Rose进行星型模式建模和雪花模式建模。飞行服务数据集市的例子为了更好地解释如何对数据仓库建模,本白皮书将使用一个简单数据集市的的例子(即一个数据仓库或者数据仓库的一部分),来分析旅客乘坐航班 Happy Flying and Landing(愉快飞行平安降落)的行为和满意程度。我们将存储乘客信息和每个航班的的相关数据、选择的菜单以及乘客对飞行的满意程度。/developerworks/cn/rational/r-warehouses/回页首数据仓库术语表数据仓库引入了新的术语,扩展了数据建模的术语表。为使本文的阐述能够完备,下面我介绍一下最常用的术语。数据仓库数据仓库是一个支持管理决策的数据集合。数据是面向主题的、集成的、不易丢失的并且是时间变量。数据仓库是所有操作环境和外部数据源的快照集合。它并不需要非常精确,因为它必须在特定的时间基础上从操作环境中提取出来。数据集市数据仓库只限于单个主题的区域,例如顾客、部门、地点等。数据集市在从数据仓库获取数据时可以依赖于数据仓库,或者当它们从操作系统中获取数据时就不依赖于数据仓库。事实事实是数据仓库中的信息单元,也是多维空间中的一个单元,受分析单元的限制。事实存储于一张表中(当使用关系数据库时)或者是多维数据库中的一个单元。每个事实包括关于事实(收入、价值、满意记录等)的基本信息,并且与维度相关。在某些情况下,当所有的必要信息都存储于维度中时,单纯的事实出现就是对于数据仓库足够的信息。我们稍后讨论有关缺无事实的情况。维度维度是绑定由坐标系定义的空间的坐标系的轴线。数据仓库中的坐标系定义了数据单元,其中包含事实。坐标系的一个例子就是带有 x 维度和 y 维度的 Cartesian(笛卡尔)坐标系。在数据仓库中,时间总是维度之一。数据挖掘在数据仓库的数据中发现新信息的过程被称为数据挖掘,这些新信息不会从操作系统中获得。分析空间分析空间是数据仓库中一定量的数据,用于进行数据挖掘以发现新信息同时支持管理决策。切片一种用来在数据仓库中将一个维度中的分析空间限制为数据子集的技术。切块一种用来在数据仓库中将多个维度中的分析空间限制为数据子集的技术。星型模式一种使用关系数据库实现多维分析空间的模式,称为星型模式。星型模式将在本白皮书中稍后进行进一步讨论。雪花模式不管什么原因,当星型模式的维度需要进行规范化时,星型模式就演进为雪花模式。/developerworks/cn/rational/r-warehouses/回页首使用 IBM Rational Rose 进行星型模式建模星型模式的基本形式必须实现多维空间(常常被称为方块),以使用关系数据库的基本功能。首先,我们需要理解多维空间。多维分析空间几何学中的方块是指一个三维空间,其中每个维度的尺寸都相同。想象一个立方体,每个维度都有三个单元,我们即得到相同结构的33=27个单元。图1 一个具有 x、y、z 维度的方块多维分析空间(或者数据仓库方块)与几何空间中的方块仅仅存在细节上的差异。维度不仅限于 3 维。不过,处理很多维度的立方体也不是件轻松的事情,这会导致大多数的实现被限制于 6 或者 7 维。不要期盼使用图形可以很好地表示超过 4

文档评论(0)

wangwangwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档