数据仓库以及数据挖掘.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息系统分析与设计 第六章 数据仓库和数据挖掘 数据仓库和数据挖掘 第六章 数据仓库和数据挖掘 第一节 数据仓库的原理 第二节 数据仓库体系结构 第三节 数据仓库的开发 第四节 联机分析处理OLAP 第五节 数据挖掘技术 第六节 数据挖掘的方法和工具 第一节 数据仓库的原理 一、数据仓库的基本定义 1. 基本定义 数据仓库专家W.H.Inmon的描述: 数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、随时间不断变化(Time Variant)的数据集合,用于支持管理决策。 第一节 数据仓库的原理 一、数据仓库的基本定义 Informix公司的负责人定义数据仓库为: 数据仓库将分布在企业网络中不同职能部门的业务数据集成,并存储在一个单一的集成关系型数据库中。 利用这种集成信息,可方便用户对信息的访问,更可使决策人员对一段时间的历史数据进行分析,研究事物发展走势。 第一节 数据仓库的原理 2. 数据仓库中的一些基本概念 ① 粒度 粒度是数据仓库的数据单位中保存数据的细化或综合程度的级别; ② 分割 就是将数据分散到各自的物理单元中去,使它们能被独立地处理; ③ 维 是人们观察数据的特定角度,是数据的视图。 第一节 数据仓库的原理 二、数据仓库的特点 ① 面向主题的 ② 集成的 ③ 相对稳定的 ④ 随时间变化的 第一节 数据仓库的原理 ① 面向主题的 数据仓库中的数据是按一定的主题进行组织的,为按主题进行决策的过程提供信息。 ② 集成的 数据仓库中数据是来源于分散的数据库数据,它们进入数据仓库中时必须通过一定的方法来使之在数据仓库中有统一的形式和含义。 第一节 数据仓库的原理 ③ 相对稳定的 也称为非易失性。数据仓库的数据主要供企业决策分析之用,某个数据一旦进入数据仓库,只要它没有数据仓库的数据存储期限,一般就不会被更新。 第一节 数据仓库的原理 ④ 随时间变化的 数据仓库随着时间的变化,不断增加新的数据。 ⑤支持决策系统 数据仓库组织的根本目的在于对决策的支持。 第一节 数据仓库的原理 三、数据仓库中的层次结构 一个典型的企业数据仓库系统3层结构: 数据获取层、 数据存储与管理层、 数据访问层 第一节 数据仓库的原理 ① 数据获取层 对MIS、网管和其他外部数据源中的数据进行抽取、清洗、转换,并加载到数据仓库。 ② 数据存储与管理层 实现对数据仓库中数据和源数据的集中存储与管理,进行抽取、清理和有效集成,按照主题进行组织,并可根据需求建立面向部门和主题的部门级数据仓库,或称为数据集市。 采用在线分析处理(OnLine Analysis Processing,OLAP)服务器技术对数据进行有效集成和组织,以便进行多角度、多层次的分析,并发现趋势。 第一节 数据仓库的原理 ③ 数据访问层 通过多样化的前端分析展示工具(主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具),实现对数据仓库中数据的分析和处理,形成市场经营和决策工作所需要的科学、准确、及时的业务信息和知识。 第一节 数据仓库的原理 四、数据仓库与数据库的区别 第二节 数据仓库体系结构 一、数据仓库的体系结构 通常包括4个部分:源数据、管理部分、数据仓库和应用部分。 第二节 数据仓库体系结构 二、数据仓库体系结构中的重要组件 1. 数据抽取、转换、装载工具ETL(Extract/Transformation/Load) 它是把数据从不同的操作型数据库中拿出来,进行必要的转化、整理,再存放到数据仓库内。 第二节 数据仓库体系结构 2. 元数据 元数据在数据仓库中的用途有: ① 起到辅助决策分析过程中定位数据仓库的目录作用 ② 数据从业务环境向数据仓库环境传送时数据仓库的目录内容 ③ 指导从近期基本数据到轻度综合数据和到高度综合数据的综合算法选择 第二节 数据仓库体系结构 3. 数据集市(Data Marts) 为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据(Subject data) 4. 数据仓库管理工具 数据仓库管理工具的主要内容有:安全和特权管理;跟踪数据的更新;数据质量检查;管理和更新元数据;审计和报告数据仓库的使用和状态;删除数据;复制、分割和分发数据;备份和恢复;存储管理 第三节 数据仓库的开发 一、数据仓库的数据模式 1. 星式模式 一个简单的星式模式(Star Schema)是由一个事实表和多个维表组成。复杂的星式模式包含若干个事实表和维表。 第三节 数据仓库的开发 2. 雪花模式 雪花模式(

文档评论(0)

sandaolingcrh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档