第01章数据仓库概述.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数学科学学院-周书锋 32? 数据仓库体系结构的基本特点 n n 数据仓库中存储的信息越有价值,保密就越 重要。为了采取防范措施,通常在网络层和 后端数据仓库中,采用对工作组授权的方 法,以防范有意的或偶然的攻击和破坏 体系结构必须是灵活的,它必须能适应不断 变化的商业规则和环境,允许对其进行有效 的修改、指导和管理,所以数据仓库必须是 可移植的。 数学科学学院-周书锋? 1? 第1章 数据仓库概述 数学科学学院-周书锋 2? n n n 数据仓库基础.段云峰等译.电子工业出版社.2004 年4月(Data Warehousing Fundamentals. Paulraj Ponniah) 数据仓库原理与实践.林宇.人民邮电出版社.2003 年1月 数据仓库与数据挖掘.陈文伟.人民邮电出版 社.2004年1月 教材 数学科学学院-周书锋 3? 引言: n 主要介绍从数据库到数据仓库的演变过程, 着重说明“蜘蛛网”问题产生原因以及随之而 来的种种问题。为此,必须将操作型环境和 分析型环境分离,使企业由以数据库为中心 的生产环境过渡到以数据仓库为中心的生产 环境。最后简要介绍数据仓库技术的应用前 景。 数学科学学院-周书锋 4? 内容? 1.1、数据库到数据仓库的演变? 1.2、操作型系统和分析型系统的分离? 1.3、数据仓库定义? 1.4、数据仓库解决的问题? 1.5、数据仓库体系结构? 1.6、数据仓库的运行结构? 1.7、一个现实的问题? 1.8、数据仓库应用前景 数学科学学院-周书锋 5? 1.1数据库到数据仓库的演变 n? 1、蜘蛛网问题 n? 2、蜘蛛网现象 n? 3、蜘蛛网问题特征 数学科学学院-周书锋 6? 1、蜘蛛网问题 n 随着数据库技术的广泛应用,企业的运营环 境逐渐转化为以数据库为中心。企业对数据 的需求是多方面的(企业级、部门级、个人 级),这样随着数据逐层提取就会形成一种? “蜘蛛网”结构,使数据的访问相当复杂。 数学科学学院-周书锋 7? 2、蜘蛛网现象 部门 个人 个人 部门 部门 部门 企业级 数据库 部门 个人 部门 个人 企业级 数据库 个人 个人 个人 个人 个人 个人 个人 数学科学学院-周书锋 8? 3、蜘蛛网问题特征 n 数据分析的结果缺乏可靠性 n 电信公司“市场部”和“计划部”对同一业务得出截 然相反的结果。 n 数据处理的效率很低 n 错综复杂的体系结构中,不同级别的数据库可能 使用不同类型的数据库系统。大型:Oracle、? DB2;中型:Microsoft?SQL?Server; 小 型:Foxpro、MySQL。 n 难于将数据转化为信息 n 综合数据处理复杂 分析程序1? 不同部门分析过程的差异 企业级数据 计划部 外部市场信息A? 外部市场信息B? 外部市场信息C? 外部信息 分析程序2? 数学科学学院-周书锋 分析结果2: 业务A没有 场前景 9? 抽取数据的内容不同 分析程序和分析内容不同 分析结果1: 业务A市场 前景很好 抽取数据的时间不同? 2001/03/05? 市场部 2001/03/25 数学科学学院-周书锋 10? 1.2操作型和分析型系统分离 n 背景: n n n n 目前,随着技术的发展和应用需求的不断提高, 以及当前的市场形势促使企业必须保持旺盛活 力。 关键:适时掌握准确信息,利用这些信息作出正 确决策。 获取和利用信息的方式就是建立覆盖企业所有部 门的企业综合信息系统。 采用不同技术使得信息必须一致、准确 数学科学学院-周书锋 11? 操作型处理和分析型处理 n 数据处理: n n 操作型:以传统的数据库为中心进行企业的日常 业务处理。如:电信计费系统,银行系统。 分析型(信息型):以数据仓库为中心分析数据 背后的关联和规律,为企业的决策提供可靠有效 的依据。如:对超市近期数据分析发现畅销商 品;对连锁店各个营业点不同时期营业情况的分 析。 n 处理目标: n n 操作型:操作员使用,实现企业的业务运营 分析型:企业的中高层管理者或从事数据分析的 工程师,为企业的决策者提供支持信息。 数学科学学院-周书锋 12? 客户数据库 计费数据库 财务数据库 操 作 型 系 统 面向操作人员,解决业务运营问题,某个数据库 只包含企业中的部分信息 数据仓库 系 统 面向管理人员,解决决策支持问题,数据仓库中 包含企业中整体的宏观信息 分 析 型 数学科学学院-周书锋 13? 两种处理的区别 分析型数据 表示业务处理的静态情况(综合 提炼) 处理过去历史数

文档评论(0)

微微 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档