数据仓库设计共91页资料.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
物理数据模型 ? 物理数据模型:星型模型等在数据仓库中的实现,如物理的存取 方式、数据存储结构等。 ? 在物理设计时,常常要按数据的重要程度、使用频率以及对响应 时间的要求进行分类,并将不同类的数据分别存储在不同的存储 设备中。重要程度高、经常存取并对响应时间高的数据就存放在 高速存储设备上,如硬盘;存取频率低或对存取响应时间要求低 的数据则可以放在低速存储设备上。 数据建模注意问题 ? 必须回答紧迫的问题; ? 必须有正确的事实表; ? 将有正确的维表,描述必须按最终用户的业务术语表达; ? 必须理解数据仓库所影响的公司过程或影响数据仓库的公司过程; ? 对于事实表,应该有正确的“粒度”; ? 根据需要存储正确长度的公司历史数据; ? 以一种对于公司有意义的方式来集成所有必要的数据; ? 创建必要的聚合表; ? 创建必要的索引; ? 能够加载数据仓库数据库并使它以一种适宜的方式可用。 数据仓库开发过程 Building the Data Warehouse 应用 A 应用 B 应用 C 收集应用需求 分析应用需求 构建数据库 系统实施 系统测试 应用编程 DB SDLC 方法 数据仓库建模 数据获取与集成 构建数据仓库 理解需求 系统测试 DSS 应用编程 DW CLDS 方法 DB 外部数据 DB 数据仓库的 CLDS 设计方法 数据仓库中的数据组织 高度综合级 轻度综合级 当前综合级 早期细节级 多级数据 从事务型处理环境中提取的源数据经过综合后,首先进入当 前细节级,并根据需要进行进一步的综合进入轻度综合级或 高度综合级,老化的数据将进入早期细节级。 粒度 ? 粒度影响数据仓库中的数据量和查询的种类; ? 聚合是构成维内不同层次的数据集,使用户能够在维度 内的不同层次上观察数据。 元数据 ? 要有效的管理数据仓库,必须设计一个描述能力强、内容完善的元数 据。 ? 元数据描述了数据仓库中源数据和目标数据本身的信息,定义了从源 数据到目标数据的转换过程。元数据可用文件存在元数据库中。 元数据的种类 ? 转换元数据:为了从事务处理型环境向数据仓库中转换而建 立的元数据,它包含了所有源数据的信息、事务描述、数据 结构的定义、提取数据和传送数据的算法、综合数据和净化 数据的规则、数据访问和传送的记录等。 ? DSS 元数据:在数据仓库中用来与终端用户的多维商业模型 / 前端工具之间建立映射,常用来开发更先进的决策支持工具。 元数据的内容 ? 与数据库的数据字典中相似的内容 ? 数据仓库的主题描述 ? 外部数据和非结构化数据的描述 ? 记录系统定义 ? 逻辑模型的定义 ? 数据进入数据仓库的转换规则 ? 数据的提取历史 ? 粒度的定义 ? 数据分割的定义 ? 广义索引 ? 有关存储路径和结构的描述 ? 关于源数据的元数据 ? 关于数据仓库映射的元数据 ? 关于系统安全的元数据。 ? 与设计时采用的具体技术以及具体应用环境有关的内容 ? 与传统数据库系统的数据字典 中相似的内容。 ? 数据仓库的主题描述。 ? 外部数据和非结构化数据的描 述。 ? 记录系统定义。 ? 逻辑模型的定义。 ? 数据进入数据仓库的转换规则。 ? 数据的提取历史。 ? 粒度的定义。 ? 数据分割的定义。 ? 广义索引。 ? 有关存储路径和结构的描述 数据仓库的虚拟存储方式 ? 数据仓库中的数据仍然存储在源数据库中,只是根据用户的多维分析需 求而形成多维视图,临时在源数据库中找出并提取所需要的数据,完成 多维分析。 ? 优点:比较简单、花费少、使用灵活 ? 缺点:要求源数据库的组织比较规范、数据完备并没有冗余,同时又比 较接近多维数据模型时,而一般数据库难以满足这些要求,在实际应用 中难以有效建立。 数据仓库的数据组织形式( 1 ) ? 简单堆积文件 :每天从操作型数据库中提取加工后的数据逐日积累的存储 起来。存储的数据细节化程度很高,可以应付多种细节查询,但分析时查询 的效率较低。 操作型数据 每日事务处理 每日综合 2 月 1 日 2 月 2 日 2 月 3 日 。。。 3 月 1 日 3 月 2 日 3 月 3 日 。。。 1 月 1 日 1 月 2 日 1 月 3 日 。。。 ? 轮转综合文件

文档评论(0)

wq1987 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档