06 Design of Data Warehouse.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本文观看结束!!! * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 谢 谢 欣 赏! * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 系统规划 - 明确主题 在数据仓库设计的开始,首先要做的事是有关分析人员需要确定具体领域的分析对象,这个对象就是主题。 主题是一种较高层次的抽象,对它的认识与表示是一个逐步完善的过程。因此,在开始时不妨先确定一个初步的主题概念以利于设计工作的开始,此后随着设计工作的进一步开展,再逐步扩充与完善。(原型设计法) * 系统规划 - 技术准备 准备具体的技术要求和物理实现环境,包括: 技术评估 其内容包括数据仓库的性能指标,如: 数据存取能力(包括管理大数据量数据的能力) 模型重组能力 数据装载能力 技术环境准备 在评估基础上提出数据仓库的软硬件平台要求,包括计算机、网络结构、操作系统、数据库及数据仓库软件的选购要求等。 * 数据仓库的设计步骤(续) 针对每一个选定的当前实施的主题 概念模型设计 逻辑模型设计 物理模型设计 数据仓库生成 数据仓库运行与维护 * 概念模型设计 确定系统边界 确定主要的主题及其内容 OLAP等分析应用的设计 * 确定系统边界 要做的决策类型有哪些? 决策者感兴趣的是什么问题? 这些问题需要什么样的信息? 要得到这些信息需要包含哪些数据源? * 确定主要的主题及其内容 确定主要的主题 即明确数据仓库的分析对象,然后对每个主题的内容进行较详细的描述,包括: 确定主题及其属性信息 描述每个属性的取值情况 固定不变的 半固定的 经常变化的 确定主题的公共码键 主题之间的关系:主题间联系及其属性 在确定上述内容后,就可以用传统的实体联系模型(E-R模型)来表示数据仓库的概念数据模型。 * 用于商场管理者的数据仓库 主题名 公共码键 属性信息 商品 商品号 固有信息:商品号,商品名,类别,颜色等 采购信息:商品号,供应商号,供应价,供应日期,供应量等 销售信息:商品号,顾客号,售价,销售日期,销售量等 库存信息:商品号,库房号,库存量,日期等 * 用于商场管理者的数据仓库(续) 主题名 公共码键 属性信息 供应商 供应商号 固有信息:供应商号,供应商名,地址,电话,供应商类型等 供应商品信息:供应商号,商品号,供应价,供应日期,供应量等 顾客 顾客号 固有信息:顾客号,姓名,性别,年龄,文化程度,住址,电话等 购物信息:顾客号,商品号,售价,购买日期,购买量等 * 商品、顾客和供应商之间的E-R图 供应商固有信息 供应商 供应商品信息 日期 供应商号 顾客固有信息 顾客号 顾客 日期 顾客购物信息 商品采购信息 商品销售信息 商品 商品号 日期 商品固有信息 商品库存信息 * 逻辑模型设计 将E-R图转换成关系数据库的二维表 定义数据源和数据抽取规则 在逻辑模型的设计过程中,需要考虑以下一些问题: 适当的粒度划分 合理的数据分割策略 定义合适的数据来源 …… * 逻辑模型设计 – 粒度划分 在设计过程中需要考虑数据仓库中数据粒度的划分原则,即数据单元的详细程度和级别。 数据越详细,粒度越小,级别就越低 数据综合度越高,粒度越大,级别就越高 一般将数据划分为:详细数据、轻度总结、高度总结三种粒度,或者采用更多级的粒度划分方法。例如: 根据时间跨度进行的统计有:天, 周, 月, 季度, 年 对于不适合进行统计的属性值,可以采样获取数据 粒度的划分将直接影响到数据仓库中的数据量以及所适合的查询类型,粒度划分是否适当是影响数据仓库性能的一个重要方面。 * 商品销售 - ‘时间’属性的粒度设计 商品固有信息: 商品表(商品号,商品名,类型,颜色,…)/* 细节数据 */ 商品销售信息: /* 细节数据 */ 销售表(商品号,顾客号,销售日期,售价,销售量,…) /* 以‘天’为时间统计单位的综合数据 */ 销售表d1(时间属性_日 ,商品属性,… ,销售总量) /* 以‘周’为时间统计单位的综合数据 */ 销售表d2(时间属性_周 ,商品属性, … ,销售总量) /* 以‘月’为时间统计单位的综合数据 */ 销售表d3(时间属性_月 ,商品属性, … ,销售总量) /* 以‘季度’为时间统计单位的综合数据 */ 销售表d4(时间属性_季度,商品属性, … ,销售总量) /* 以‘年’为时间统计单位的综合数据 */ 销售表d5(时间属性_年,商品属性, … ,销售总量) …… * 商品销售 - ‘商品’属性的粒度设计 商品销售信息(续) /* 细节数据 */ 销售表(商品号,顾客号,销售日期,售价,销售量,…)

您可能关注的文档

文档评论(0)

xx88606 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档