- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
02DataWarehouse1讲义
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 1. 面向主题(3/15) 面向应用的数据组织特点 表达数据流程 和业务中的单据或文档对应 逻辑、数据不完全分离 和部门、组织相关 面向应用的数据组织基本上是按照企业内部的业务活动及其需要的相关数据来组织数据的存储的,虽然能够方便高效的支持OLTP,但没有实现真正的数据与应用分离,其抽象程度也不够高 * 1. 面向主题(4/15) 主题(Subject) 主题是较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象。在逻辑意义上,是对应企业中某一宏观分析领域涉及的分析对象 例如: CRM,客户关系管理 优质客户的挖掘 新客户的发现 …… ERP,企业资源计划 销售管理 产品质量控制 库存管理 …… * 1. 面向主题(5/15) 面向主题 面向主题是指数据仓库内的信息是按主题进行组织的,为按主题进行决策的过程提供信息 传统数据库中的数据是原始、基础数据 而特定分析领域数据则是需要对它们作必要的抽取、加工与总结而形成 数据仓库是面向分析、决策人员的主观要求的,不同的用户有不同的要求,同一个用户的要求也会随时间而经常变化,因此,数据仓库中的主题有时会因用户主观要求的变化而变化 * 1. 面向主题(6/15) 如果按照面向主题的方式进行数据组织,首先应该抽取主题,即按照管理人员的分析要求来确定主题,而与每个主题相关的数据又与有关的事务处理所需的数据不尽相同。 在该例中,我们可以抽取出三个不同的主题(即分析对象)及其相关的数据: 商品 供应商 顾客 * 1. 面向主题(7/15) 主题一:商品 商品固有信息 商品号,商品名,类别,颜色等 商品采购信息 商品号,供应商号,供应价,供应日期,供应量等 商品销售信息 商品号,顾客号,售价,销售日期,销售量等 商品库存信息 商品号,库房号,库存量,日期等 * 1. 面向主题(8/15) 主题二:供应商 供应商固有信息 供应商号,供应商名,地址,电话等 供应商品信息 供应商号,商品号,供应价,供应日期,供应量等 主题三:顾客 顾客固有信息 顾客号,顾客名,性别,年龄,文化程度,住址,电话等 顾客购物信息 顾客号,商品号,售价,购买日期,购买量等 * 1. 面向主题(9/15) 在每个主题中,都包含了有关该主题的所有信息,同时又抛弃了与分析处理无关或不需要的数据,从而将原本分散在各个操作性处理系统中的有关信息集中在一个主题中,形成有关该主题的一个完整一致的描述 面向主题的数据组织方式所强调的就是要形成一个这样一致的信息集合 * 商品 固有信息 库存信息 销售信息 采购信息 面向主题的数据组织方法 1. 面向主题(10/15) 不同的主题之间也有重叠的内容,但这种重叠的特点是: 是逻辑上的,而不是物理存储上的重叠 是部分细节的重叠,而不是统计信息的重叠 可以反映不同主题之间的直接和间接的联系 * 商 品 供应商 顾 客 主题之间的重叠关系示意图 1. 面向主题(11/15) 每个主题所需数据的物理存储: 多维数据库(MDDB,Multi-Dimensional Database) 用多维数组形式存储数据 关系数据库 用一组关系来组织数据的存储,同一主题的一组关系都有一个公共的关键字 在关系中存放的不是细节性的业务数据,而是经过一定程度的综合形成的综合性数据 这是目前实现数据仓库中数据的物理存储的常用方法 * 1. 面向主题(12/15) 以“商品”这个主题为例,其公共码键是“商品号”,其关系存储如下: 商品的固有信息 细节数据 商品表(商品号,商品名,类型,颜色,…) 综合数据 商品表1(商品类别,商品颜色) 商品表2(价格,商品种类) …… * 1. 面向主题(13/15) 采购信息 细节数据 采购表(商品号,供应商号,供应日期,供应价,…) 综合数据:根据不同的时间段(月、季度、年)来统计商品的采购总量 采购表H1(商品号,时间段1,采购总量,…) …… 采购表Hn(商品号,时间段n,采购总量,…) * 1. 面向主题(14/15) 销售信息 细节数据 销售表(商品号,顾客号,销售日期,售价,销售量,…) 综合数据:根据不同的时间段(日、周、月、年)统计得到的销售总量 销售表1(商品号,时间段1,销售总量,…) …… 销售表n(商品号,时间段n,销售总量,…) * 1. 面向主题(15/15) 库存信息 细节数据 库存表(商品号,库房号,库存量,日期,…) 综合数据:根据不同的时间点抽样得到的商品库存数量 库存表1(商品号,库房号,库存量,星期,…) …… 库存表n(商品号,库房号,库存量,年份,…) * 2. 集成 数据仓库中的数据是为分析服务的,而
原创力文档


文档评论(0)