- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库与数据挖掘(一)
数据仓库的发展历程 经典案例 主要应用 框架结构 构造模式 主要技术 国内外发展现状 未来展望 参考文献 在移动通信中的应用 在期货行业的应用 在处理中医方剂评析的应用 在电力系统中的应用 在电信行业的应用 在地铁交通系统中的应用 * 数据仓库的发展历程 计算机系统的功能从数值计算扩展到数据管理距今已有三十多年了。最初的数据管理形式主要是文件系统,少量的以数据片段之间增加一些关联和语义而构成层次型或网状数据库,但数据的访问必须依赖于特定的程序,数据的存取方式是固定的、死板的。到了1969年,E.F.Codd博士发表了他著名的关系数据模型的论文。此后,关系数据库的出现开创了数据管理的一个新时代。 开始阶段(1978—1988) 20世纪70年代,MIT研究的一种优化技术架构,这项研究将业务系统和分析系统分开,将业务处理和分析处理分成不同的层次。80年代后期,DEC开始采用分布式网络架构支持其业务应用,并且建立了YA2(Technical Architecture 2)规范,包括数据获取、数据访问、目录、用户服务四个组成部分。 全企业集成(1988) 为解决全企业集成问题,IBM公司第一次提出了“信息仓库”概念。 90年代初期数据仓库的基本原理、框架架构,以及分析系统的主要原则都已经确定。 1988-1991年,一些前沿的公司已经开始建立数据仓库。 企业级数据仓库(EDW,1991) 1991年,Bill Inmon 出版了有关数据仓库的第一本书,这本书不仅说明为什么要建数据仓库、数据仓库能给你带来什么,更重要的是,第一次提供如何建设数据仓库的指导性意见,概述定义了数据仓库非常具体的原则。Bill Inmon也被称之为“数据仓库之父”。 数据集市(1994-1996) Ralph Kimball的第一本数“The DataWarehouse Toolkit”掀起了数据集市的狂潮,从此,数据集市逐渐取代企业级数据仓库。 争吵与混乱(1996-1997) 企业级数据仓库还是部门级数据集市?关系型还是多维?Bill Inmon和Ralph Kimball一开始就争论不休。但两者各有利弊。 合并(1998-2001) Bill Inmon推出了新的BI架构CIF(Corporation information factory),把Ralph Kimball的数据集市包容进来。现在CIF已经成为建设数据仓库的框架指南。 物流案例分析:加拿大皇家银行应 用数据仓库的启示 加拿大皇家银行是世界级的银行巨头之一,拥有1400家分行,为1000多万名客户提供金融服务。随着客户与银行竞争者的日渐增加,在技术与结构调整上的分析效益必须越来越好。更重要的是,要能够快速回应如此激烈的竞争环境和以客户为导向的趋势。因此,皇家银行决定构建银行的客户关系管理系统,以便增强客户关系,扩大竞争优势。皇家银行清楚地认识到利润贡献度分析系统对于客户关系管理系统的重要性,它可以说是在服务提升、产品提供、成本管理、价格策略和营销费用上具有决定性的工具. 加拿大皇家银行经过对NCRTeradata数据仓库解决方案的严格测试和调查,最终选择了TeradataValueAnalyzer(利润贡献度分析系统)。 尽管每一账户可以归属于一位客户、产品或渠道,但是无论以何种方式统计,银行都希望确保原始使用的资料仍能与银行内的具有一致性。这就是ValueAnalyzer的真正意义。利用ValueAnalyzer的客户分级制度来重新计算客户的利润贡献度,结果显示皇家银行有75%的客户增加了20%以上的利润。 从皇家银行实施ValueAnalyzer把“市场占有率”观念转变为“利润贡献度”观念,我们可以清晰地发现能够使企业成长和发展的并不是市场占有率的多少,而是客户利润贡献度的大小。也就是说,客户的数量并不是决定企业竞争优势的关键因素,而客户的质量才是推动企业增长的动力引擎。除了皇家银行之外,像美洲银行、荷兰皇家银行、东京三菱银行等一些国际银行巨头也采用了Teradata数据仓库系统。这说明数据仓库技术对银行业务的发展起着决定性的作用,它是银行决策的基础平台,是银行区分利润来源的分析引擎。 主要应用: 数据仓库的体系结构: 数据仓库用来保存从多个数据库或其他信息源选取的数据,并为上层应用提供同一用户接口,完成数据查询和分析。 数据仓库是为支持整个企业范围的主要业务建立的,主要特点是:包含大量面向这个企业的综合信息及导出信息。 作为一种数据环境必要功能包括:数据收集、数据存储、数据传递。 数据仓库体系结构 收集——存储——传递 数据仓库组成: 数据仓库体系结构 最流行的数据仓库数据模型是多维数据模型,这种模型可以是星型模型、雪花模型等形式: 星型模型的结构
文档评论(0)