- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
下载
第2章 数据仓库环境
数据仓库是体系结构设计环境的核心,是决策支持系统 ( D S S )处理的基础。因为在数据仓
库中只有单一集成的数据资源,并且因为数据是可访问的,所以与传统数据环境相比,在数
据仓库环境中D S S分析员的工作将要容易得多。
本章将叙述数据仓库问题的一些重要特性。
数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管
理人员的决策。
数据仓库的面向主题性,如图 2 - 1所示。
面向主题
操作型环境 数据仓库
汽车 顾客
人寿 保险单
健康 保险费
意外伤亡 索赔
应用 主题
图2-1 数据面向主题的一个例子
传统的操作型系统是围绕公司的应用进行组织的。对一个保险公司来说,应用问题可能
是汽车保险、健康保险、人寿保险与意外伤亡保险。公司的主要主题范围可能是顾客、保险
单、保险费与索赔。
数据仓库的第二个显著特点是集成的。在数据仓库的所有特性之中,这是最重要的。图
2 - 2说明了当数据由面向应用的操作型环境向数据仓库传送时所进行的集成。
应用问题的设计人员历经多年制定出来的不同的设计决策有很多很多种不同的表示方法,
没有什么应用在编码、命名习惯、实际属性、属性度量等方面是一致的,各个应用问题设计
第2章 数据仓库环境 21
下载
员自由地做出他或她自己的设计决策。
当数据进入数据仓库时,要采用某种方法来消除应用问题中的许多不一致性。例如,在
图2 - 2 中,考虑关于“性别”的编码,在数据仓库中是编码为 m / f还是 1 / 0并不重要,重要的是,
无论什么原始应用问题,无论数据仓库如何进行编码,在数据仓库中应该一致地进行编码。
如果应用数据编码为X / Y ,当其进入数据仓库时就要进行转换。对所有的应用设计问题都要考
虑同样的一致性处理,比如命名习惯、键码结构、属性度量以及数据特点等。
数据仓库的第三个重要特性是数据仓库是非易失的。图 2 - 3说明了数据的非易失性。
集成
操作型环境 数据仓库
编码
应用A m, f
应用B 1, 0 m, f
应用C x, y
应用D 男,女
属性度量
应用A 管道—c m
应用B 管道— i n c h e s 管道—c m
应用C 管道—m c f
应用D 管道—y d s
多重信息源
应用A 描述
应用B 描述
文档评论(0)