第五章-数据仓库和商业智能.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章-数据仓库和商业智能

第五章 数据仓库+OLAP 课程导入: DSS的数据大多来自于事务处理系统。随着信息系统处理能力的增强,所产生的数据越来越多,如何解决数据的整合性和提高分析的有效性,成为DSS发展的难题。 问题:MIS中的数据库难道还不满足数据整合分析的要求吗?为什么?瓶颈在哪里? 5.1 数据仓库 数据仓库出现的背景: 1.DSS的数据来源:不同的事务处理部门,每个部门都有独立的数据库,因此,数据库的结构有所不同,一般有以下三种结构: 用例子说话:某企业的销售数据查询 5.1.2 数据仓库的定义 数据仓库(Date Warehouse,DW)是一种数据资源架构。是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合,它用于支持企业或组织的决策分析处理。 数据仓库之父Bill Inmon的定义: 在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受——数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。 定义解读:   ◆面向主题:操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的(例如顾客、政策类型、保险公司索赔等)。 面向主题使用户可以不仅能够确定他们的企业运转如何,而且知道为什么。 ◆集成的: 数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。 不同地点保存的数据也许编码类型不同,例如性别数据在一个地方以“0”和“1”进行编码,而在另一个地方以“F”和“M”表示。这样的数据要进入到数据仓库中,要先被清洗成同一种格式,使数据具有标准化和一致性的特点。另外,数据和时间格式在世界各地也不同。 ◆相对稳定的:数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。因此,数据仓库需要大量的自由空间为数据量增长做准备。 ◆反映历史变化: 数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。 数据仓库的数据通常保存5~10年甚至更长时间用于趋势分析、预测和比较。时间维是所有数据仓库必须支持的一个重要维度。 不同角度解读“数据仓库” 设计者视角:数据仓库的关键成功因素在于如何设计其中的数据存储中心的结构以及它的一套数据转换和操作机制,使得作业性数据能够以恰当的形式进入数据仓库并得到妥善的管理,在需要的时候能有效的被决策者所利用。 数据使用者视角:数据仓库应当根据不同的管理活动的需要,对作业性数据从多角度进行加工处理。 数据仓库支持第一美国银行的企业战略 第一美国银行(First American)改变企业战略从传统的公司经营方法转向成为创新金融服务的领袖,如果没有一个被称为“VISION”的数据仓库,这一战略的成功实施是不可能的。这个数据仓库中保存顾客行为数据,例如顾客使用过的产品、购买偏好和顾客价值层次。 VISION系统提供了: 识别前20%的盈利顾客; 识别40%--50%的非盈利顾客; 顾客保留策略; 低成本的分销渠道; 扩展顾客关系的战略; 信息流的再设计。 通过数据仓库获取信息能够促进渐进的和革命性的变革。第一美国银行获得的革命性的变革,是它成功成为“Sweet 16”的金融服务公司。 西尔斯公司的数据仓库 到2002年4月,西尔斯罗巴克公司部署了95TB的新的数据存储。这一容量是原来的3倍。西尔斯公司将两个关键的数据仓库统一起来并建立一个存储的网络,能够用库存和销售数据仓库处理顾客信息。 依靠这一系统,西尔斯能够执行有效的目标直邮促销。大约5000名西尔斯员工出于分析目的使用数据仓库。他们能够得到促销信息,分析单个顾客的购买情况并和历史购买记录联系起来。 数据集市(Data Mart)是部门级的数据仓库,或是为某种专门的用途开发的数据存储系统。 数据仓库的高成本使其主要应用于大公司中,作为替代方案,许多企业使用低成本、小规模的数据集市。 数据集市的优点:

文档评论(0)

asd522513656 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档