- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库的结构StructureofDataWarehouse.ppt
简单堆积文件 操作型数据 每日事务处理 每日综合 2月1日 2月2日 2月3日 。。。 3月1日 3月2日 3月3日 。。。 1月1日 1月2日 1月3日 。。。 每天从操作型数据库中提取加工后的数据逐日积累的存储起来。存储的数据细节化程度很高,可以应付多种细节查询,但分析时查询的效率较低。 每日事务处理 每日综合 操作型数据 第1天 第2天 第3天… 第7天 第1周 第2周 第3周… 第5周 第1月 第2月 第3月… 第12月 第1年 第2年 第3年… 第n年 轮转综合文件 数据存储单位被分为日、周、月、年等几个级别,逐级综合。 1月份彩电销售 海尔 68 长虹 100 东芝 20 熊猫 10 …… …… 2月份彩电销售 海尔 150 长虹 90 东芝 40 熊猫 30 …… …… 海尔 1月份至今 218 长虹 1月份至今 190 东芝 1月份至今 60 熊猫 1月份至今 40 …… …… …… 简单直接文件与连续文件 简单直接文件:类似于简单堆积文件,但它是间隔一定时间的数据库快照,比如每隔一星期或一个月作一次。 连续文件:通过两个比较简单直接文件的不同而生成的。 数据库的体系化环境 是在一个企业或组织内部,由各面向应用的OLTP数据库及各级面向主题的数据仓库所组成的完整的数据环境 操作型环境、分析型环境 四层体系化环境 操作型环境——OLTP 全局级——数据仓库 部门级——局部仓库 个人级——个人仓库,用于启发式的分析 数据集市(Data Mart) 特定的、面向部门的小型数据仓库 是为满足用户特定需求而创建的数据仓库 是数据仓库的子集 数据库的体系化环境 数据库的体系化环境 数据仓库的设计 Design of Data Warehouse 数据模型(逻辑模型) 星型模式(Star Schema) 事实表(fact table),存放基本数据,相关主题的数据主体(BCNF) 维(dimension),影响、分析主体数据的因素 量(measure),事实表中的数据属性 维表(dimension table),表示维的各种表 维是量的取值条件,维用外键表示 以事实表为中心,加上若干维表,组成星型数据模式 例:产品-商店-销售额 CustSales LocationSales ProdSales TimeSales Sales time id pk,fk product id pk,fk location id pk,fk customer id pk,fk sales revenue units sold Product product id pk make model Time time id pk date year quarter month week Location location id pk region city store Customer customer id pk category group Sales fact Sales measures Time dimension Attributes of the time dimension 数据模型(逻辑模型) 雪花模式(Snowflake Schema) 维一般是由若干层次组成 把维按其层次结构表示成若干个表 规范化、节省存储空间 但需多做连接操作 CustSales LocationSales ProdSales TimeSales Sales time id pk,fk product id pk,fk location id pk,fk customer id pk,fk sales revenue units sold Product product id pk make model Time time id pk date year quarter month week Location location id pk region cityid store Customer customer id pk category group Sales fact Sales measures city city id pk name zip city 多维数据分析 Multi-Dimensional Data Analysis 联机分析处理——OLAP 是针对特定问题的联机访问和分析。 通过对信息的很多种可能的观察形式进行快速
原创力文档


文档评论(0)