《数据仓库与数据挖掘第三章 数据仓库的设计(31P).pptVIP

《数据仓库与数据挖掘第三章 数据仓库的设计(31P).ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《数据仓库与数据挖掘第三章 数据仓库的设计(31P)

* 数据仓库系统的完善工作: 改正性维护:在数据仓库设计与开发过程中,虽然已经进行了严格的测试,但对于一个大型的系统可能还潜藏着一些错误,改正性维护就是为了发现和改正这些错误而进行的过程。 适应性维护:数据仓库的构建是基于当时的技术条件的,由于计算机科学技术发展十分迅速,每隔一定的周期硬件设备和系统软件都会发生重大的变革,适应性维护就是为了与变化了的环境相配合而进行的对系统进行修改的活动。 完善性维护:因为数据仓库系统一般是采用快速原型法开发的,需要在系统的运行过程中不断地听取用户对已有功能的修改建议和增加新功能的需求,使系统日趋完善,这项工作称为完善性维护。 预防性维护:预防性维护则是指为了改进系统未来的性能和功能打下基础而进行的修改工作。 * 第三章 数据仓库的设计 本章要点 数据仓库的设计步骤 高层设计 技术准备工作 中层设计 低层设计 数据仓库生成 * 数据仓库的数据组织:简单堆积 2004/1/1 ……… 2004/1/31 ……… 2004/2/1 ……… 2004/2/28 ……… ┉ ┉ ┉ ………┉ 2004/12/1 ……… 2004/12/30 ……… * 数据仓库的数据组织-轮转综合 2004/1/1 ……… 2004/1/7 ……… 第1周 ……… 第5周 ……… 第1月 ┉ 第12月 ………┉ 第1年 ……… 第n年 ……… *   高细节:低粒度        低细节:高粒度 例:顾客一个月内通话细节     顾客一个月内通话综合 日期           月份 时间           通话总次数 通话人姓名        通话人姓名 通话人ID 通话人ID 接线员帮助        长途次数                    电话接通状态       中断次数 通话时间 平均时长 长途 移动电话 特别折扣率 * 李三                   2005年四月份    2005年4月12日下午 6:01-6:12   李三 0871-503155 接线员帮助    通话次数-45 2005年4月13日下午 8:01-8:12  通话平均长度-14分钟   0871-503105 长途       长话次数-8个 2005年4月15日下午 6:01-6:12   接线员帮助-2个 0871-503195          未接通电话-1个 2005年4月18日下午 9:01-9:12 0871-543155  2005年4月22日下午 16:01-16:12 0871-503155 未接通 2005年4月29日下午 18:01-18:12 0871-903155 号码错误 * 综合数据表--------------细节数据表 综合表名 字段 是否导出字段 表名 字段 按月综合通话表 客户名 否 客户通话细节表 客户名 按月综合通话表 通话年月 是 根据通话日期提取时间信息 按月综合通话表 通话次数 是 根据通话次数求和 按月综合通话表 通话平均长度 是 * 数据仓库的数据组织-简单直接 2001年1月采购表 2001年2月采购表 商品编号 商品名 购买地点 1 牙膏 上海 2 毛巾 广州 3 水杯 深圳 商品编号 商品名 购买地点 1 牙膏 北京 2 毛巾 广州 6 裤子 宁波 3 笔 杭州 * 数据仓库的数据组织-连续文件 商品编号 商品名 购买地点 时间 1 牙膏 上海 2001,1 1 牙膏 北京 2001,2 2 毛巾 广州 2001,1-2001,2 3 笔 杭州 2001,2 4 水杯 深圳 2001,1 6 裤子 宁波 2001,2 * 收集应用需求 分析应用需求 构建数据库 数据仓库建模 数据获取与集成 构建数据仓库 系统实施 应用编程 系统测试 DSS应用编程 系统测试 理解需求 DB 应用B 应用A DB DB 外部 数据 DW SDLC方法 * 数据仓库设计的技术要求 对大量数据的组织和管理。 支持高性能的复杂分析。 对提取出来的数据进行集成。 对高层决策的最终用户提供工具。 * 数据仓库的设计步

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档