PUBS数据仓库设计.pptx

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

设计要求以SQLServer2000提供的pubs示例数据库作为OLTP源系统。Pubs是一个图书出版公司的数据库,记录图书出版及销售等各方面信息。该公司销售部门的决策者急于使用数据仓库以及OLAP来为他们的销售策略作辅助支持,为销售部门设计一个数据集市。

数据介绍

数据介绍序号数据表名称作用1publishers出版社表记录出版社的基本信息2Pub_info出版社信息表记录出版社的标志和其他信息3employee雇员表记录雇员的基本信息4jobs工作表记录工作的基本信息5roysched版税表记录图书版税情况6titles图书表记录图书的基本信息7titleauthor图书作者表记录图书和作者间的关系8authors作者表记录作者基本信息9sales销售表记录图书在各书店的销售信息10stores书店表记录书店的基本信息11discounts折扣表记录书店的打折信息

分析需求希望针对每个出版社作图书销售业绩分析希望针对每个国家的出版社作图书销售业绩分析希望针对每个州的出版社作图书销售业绩分析希望针对每个城市的出版社作图书销售业绩分析希望针对每本图书作图书销售业绩分析希望针对每类图书作图书销售业绩分析希望针对每年出版的图书作图书销售业绩分析希望针对每位作者所编写的图书作图书销售业绩分析希望针对每个书店作图书销售业绩分析希望针对每个州的书店作图书销售业绩分析希望针对每个城市的书店作图书销售业绩分析希望针对年、季、月作销售业绩分析

设计分析分析角度包括:出版社、图书、作者、书店和时间5类;分析主题:销售;

设计分析出版社:单个出版社国别州城市图书:单个图书图书类别图书销售日期书店:单一书店州城市时间:年、季、月

数据筛选Publishers:出版社的名称和地理位置信息都需要做销售分析,因此publishers表中的所有字段都应当加入到数据仓库中;Pub_info:不需要参考出版社的详细信息,排除;Employee、job:同样处理;Roysched:多维分析不会对图书的缴税情况以及税种感兴趣,因此排除;涉及到的其他字段royalty也同样处理;Title:预付款、年销售量、出版日期、摘要说明等信息也不必考虑;Author:只关心有哪些作者、不关心作者的电话号码、住址、所在州和城市。Discounts:折扣信息暂时不考虑;

识别事实数据与维度数据事实数据维度数据规模几百万笔/上亿笔数据远比事实数据少数据标识拥有多个外键只有单一主键数据类型数值数据字符数据数据性质不会改变经常改变

识别事实数据与维度数据四个步骤搜索最基本业务,他们极可能是事实数据;搜索每一个事实数据的关键码,他们极可能是维度数据;检验每一个可能是事实数据的字段,确定它不是嵌入在事实数据中的维度数据;检验每一个可能是维度的字段,确定它不是嵌入在维度数据中的事实数据;

识别事实数据与维度数据首先将维度数据区分为如下5项:出版社维度作者维度图书维度书店维度时间维度

识别事实数据与维度数据Publishiers(pub_id,pub_name,city,state,country)都属于维度数据而且,属于出版社维度,其中city,state,country具有层次结构;Title(title_id,title,type,price,pub_id),其中price属于事实数据,以图书单价来分析数据;其余字段属于图书维度;Authors表中的3个字段都是维度数据,属于图书维度;Sotre表中的5个字段属于维度数据,并且属于书店维度,其中city,state具有层次结构;Sale表中ord_date,store_id,title_id都属于维度数据,分别属于时间维度、书店维度、图书维度。qty字段是由业务行为生成的属于事实数据。

识别事实数据与维度数据事实表:salespub_idchar(4)publishers表出版社编号stor_idchar(4)stores表书店编号title_idvarchar(6)titles表图书编号ord_datedatetime(8)sales表订购日期qtysmallint(2)sales表订购数量unipricemoney(8)titles表的price字段单价totalmoney(8)计算生成(qty*unitprice)总价

识别事实数据与维度数据

您可能关注的文档

文档评论(0)

187****7670 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档