数据仓库与数据挖掘 UNIT 1 决策支持系统发展.pptVIP

数据仓库与数据挖掘 UNIT 1 决策支持系统发展.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
UNIT one 决策支持系统 的发展 本 讲 主 要 目 标 学完本讲后,你应该能够了解: 决策支持系统的演化过程受硬件发展、软件技术、数据积累和应用需求的影响 自然演化体系结构阶段存在三大问题:数据缺乏可信性、生产率低下以及难以将数据转换为信息; OLTP数据应用与DDS数据应用之间的差异; 数据仓库体系结构设计中要考虑的主要问题:结构层次划分、冗余、粒度和集成问题; 数据仓库的用户和需求特征; 数据仓库开发生命周期的特点; 建立物理数据仓库的好处; 监控数据仓库环境的两个主要内容:数据与数据的使用,以有效地管理运行中的数据仓库环境。 一.决策支持系统的演化过程 二.自然演化体系结构的问题 三.数据仓库体系结构设计环境 四.数据仓库的用户及需求特征 五.数据仓库的开发生命周期 六. 建立物理的数据仓库 七. 监控数据仓库环境 决策支持系统的演化过程 决策支持系统的演化过程 信息需求的改变 —— 从信息检索到知识发现 决策支持系统的演化过程 淹没于数据,但饥饿于知识 决策支持系统的演化过程 决策支持系统的演化过程 演化过程进行到抽取程序阶段 自然演化体系结构的问题 自然演化体系结构的问题 自然演化体系结构 贯穿于公司或组织的抽取处理模式很常见,这种由失控的抽取过程产生的结构被称为“自然演化体系结构” --- 当一个组织以放任自流的态度处理整个软、硬件体系结构时,就会发生这种情况。组织越庞大,越成熟,自然演化体系结构问题就变得越严重 自然演化体系结构的问题 自然演化体系结构 对于决策者的即时信息需求,直接从OLTP系统中产生报告 – 使DBA忙乱不堪也使OLTP负载太重! 自然演化体系结构的问题 自然演化体系结构 从OLTP中将决策者常用的数据抽取出来,单独物理存放,解决了OLTP系统负载太重的问题 自然演化体系结构的问题 自然演化体系结构 抽取的数据太多和太多层次,产生了蜘蛛网问题,由此导致了一系列问题 自然演化体系结构的问题 自然演化体系结构的问题 忙碌的IT人员 蜘蛛网问题 数据缺乏可信性 生产率问题 从数据到信息的转换的不可行性 自然演化体系结构的问题 忙碌的IT人员 自然演化体系结构的问题 蜘蛛网问题 自然演化体系结构的问题 数据缺乏可信性 自然演化体系结构的问题 数据缺乏可信性 数据缺乏可信性的原因: 数据无时基 数据算法上的差异 抽取的多层次 外部数据问题 无起始公共数据源 自然演化体系结构的问题 数据缺乏可信性 自然演化体系结构的问题 生产率问题 管理者期望用数年来积累的数据集合和众多文件生成一张企业报表,设计者为产生该报表需要做三件事: 定位报表需要的数据并分析数据 要进行数据定位,必须分析很多文件和数据布局,而且,数据名存在同名异义,异名同意的现象 为报表编辑数据 为完成以上工作,召集程序员/分析员取得数据而必须编制的程序很简单,但: 要写的程序很多 每个程序必须是定制的 程序涵盖了公司所拥有的所有技术 自然演化体系结构的问题 生产率问题 自然演化体系结构的问题 生产率问题 由于事先不知道未来的企业报表需求,前面的报表几乎不可能为将来的别的企业报表需求做出什么贡献 自然演化体系结构的问题 从数据到信息的转换的不可行性 考虑银行环境中的一个典型需求:今年的帐号活动与过去五年中各个年份的帐号活动有何不同? 要满足该需求遇到很多困难: 集成化问题 从现存的系统中寻求必要的数据,需要遇到很多应用程序 缺少应用程序之间的集成 在应用程序中没有足够的历史数据 自然演化体系结构的问题 从数据到信息的转换的不可行性 集成化问题 自然演化体系结构的问题 从数据到信息的转换的不可行性 历史数据问题: 自然演化体系结构的问题 OLTP与OLAP的差异 自然演化体系结构的问题 数据仓库的产生 为决策者建立一个集成的数据源 – 数据仓库 数据仓库体系结构设计环境 数据仓库体系结构设计环境 数据仓库的体系结构 数据仓库体系结构设计环境 数据仓库的体系结构需要考虑的问题 多层次结构支持不同查询需求 数据集成问题 数据仓库体系结构设计环境 多层次结构支持不同查询需求 数据仓库体系结构设计环境 数据集成问题 数据仓库的 用户及需求特征 数据仓库的用户及需求特征 数据仓库的用户 DSS分析员 数据仓库的需求特征 DSS分析员的想法: 给我看一下我说我想要的东西,然后,我告诉你我真正想要什么 DSS分析员需求重要的理由: 它是合理的 它是广泛的 它对数据仓库的开发方式和系统怎样使用被开发的数据仓库有深远的影响 数据仓库的 开发生命周期 数据仓库的开发生命周期 传统的系统开发生命周期是SDLC 数据仓库的开发生命周期 SDLC是典型的需求驱动开发生命周期,CLDS是典型的数据驱动开发

文档评论(0)

nnh91 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档