数据仓库_历史与现在发展状况.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库 一 数据仓库简介 随着处理信息量的不断加大,企业需要多角度处理海量信息并从中获取支持决策的信息, 面向事务处理的操作型数据库就显得力不从心,面向主题集成大量数据的数据仓库技术产 生。数据仓库因其面向主题性,集成性,稳定性和时变性,不仅在数据的集成,存储上效果 好,在从操作系统提取信息和支持系统造作者的前端工具上更是充分利用了数学严谨的逻辑 思维和统计学知识,以及先进的信息技术,使企业的信息利用更有价值。数据仓路按照特定 的方法(ETL )从数据源中提取数据,以特定主题作维度利用特定的算法集成数据,给数据 用户提供实时查询,最终集成有效信息供决策者使用。数据仓库是个过程而不是一个项目, 是一个解决方案而不是一个产品。 数据仓库之父比尔·恩门 (Bill Inmon)在 1991 年出版的“Building the Data Warehouse” (《建 立数据仓库》)一书中所提出的定义被广泛接受,数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant ) 的数据集合,用于支持管理决策。 二 数据仓库历史 1.1981 年 NCR 公司(national cash register corporation )为Wal mart 建立了第一个数据仓库, 总容量超过 101TB(十年的会计文档还不足 1TB) 2.商务智能的瓶颈是从数据到知识的转换。1979 年, 一家以决策支持系统为已任、致力于 构建单独的数据存储结构的公司 Teradata 诞生了。Tera,是万亿的意思,Teradata 的命名表 明了公司处理海量运营数据的决心。1983 年,该公司利用并行处理技术为美国富国银行 (Wells Fargo Bank )建立了第一个决策支持系统。这种先发优势令Teradata 至今一直雄居 数据行业的龙头榜首。 3. 1988 年,为解决企业集成问题,IBM 公司的研究员 Barry Devlin 和 Paul Murphy 创造性的 提出了一个新的术语:数据仓库(Data Warehouse ) 4.1992 年,比尔·恩门(Bill Inmon )出版了《如何构建数据仓库》一书,第一次给出了数据 仓库的清晰定义和操作性极强的指导意见,真正拉开了数据仓库得以大规模应用的序幕。 5.1993 年,毕业于斯坦福计算机系的博士拉尔夫·金博尔,也出版了一本书:《数据仓库的工 具》(The Data Warehouse Toolkit ),他在书里认同了比尔·恩门对于数据仓库的定义,但却在 具体的构建方法上和他分庭抗礼。最终拉尔夫金博尔尔由下而上,从部门到企业的数据仓库 建立方式迎合人们从易到难的心理,得到了长足的发展。 6.1996 年,加拿大的 IDC (international date corporation )公司调查了62 家实现数据仓库的 欧美企业,结果表明:数据仓库为企业提供了巨大的收益、进行数据仓库项目开发的公司在 平均 2.72 年内的投资回报率为 321% 。 7 .到如今,数据仓库已成为商务智能由数据到知识,由知识转化为利润的基础和核心技术。 8.在国内,因数据仓库的实施需要较多的投入,再加之需要足够的数据积累才能看到结果, 不能很好的被企业普遍接受。对数据仓库的发展产生了一些负面影响。但实时的,多维的处 理海量数据已成为信息时代企业发展所必须的工作。 三 主流数据仓库产品 IBM 、Oracle、Sybase、CA、NCR 、Informix 、Microsoft 和 SAS 等有实力的公司相继通过收 购或研发的途径推出了自己的数据仓库解决方案。BO 和 Brio 等专业软件公司也前端在线分 析处理工具市场上占有一席之地。根据各个公司提供的数据仓库工具的功能,可以将其分为 3 大类:解决特定功能的产品(主要包括 BO 的数据仓库解决方案)、提供部分解决方案的 产品(主要包括 Oracle、IBM 、Sybase、Informix 、NCR 、Microsoft 及 SAS 等公司的数据仓 库解决方案)和提供全面解决方案的产品(CA 是目前的主要厂商)。 1 、BusinessObjects (BO )数据仓库解决方案 BO 是集查询、报表和 OLAP 技术为一身的 IDSS,它使用独特的语义层和动态微立方技术 来表示数据库中的多维数据,具有较好的查询和报表功能,提供钻取等多维分析技术,支持 多种数据库,同

文档评论(0)

177****1520 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档