数据挖掘复习资料.docVIP

  • 8
  • 0
  • 约2.59千字
  • 约 23页
  • 2017-08-30 发布于安徽
  • 举报
1 什么是数据仓库? 数据仓库是一个面向主体的、集成的、时变的、非易失的数据集合,支持管理过程的决策过程 数据仓库排除与对于决策无用的数据,提供特定主题的简明视图。通过集成多个异种数据源而构成 数据仓库总是物理地分离存放数据,这些数据源于操作环境下的应用数据操作性的数据更新不会发生在数据仓库的环境下. 2 联机事务处理OLTP (on-line transaction processing) ??传统的关系DBMS的主要任务 ??他们涵盖了一个组织的大部分日常操作:购买、库存、制造、银行、工资、注册、记账等。 联机分析处理OLAP (on-line analytical processing) ??数据仓库系统的主要任务 ??数据分析和决策 ??OLTP和OLAP的区别 ??用户和系统的面向性:OLTP面向顾客,而OLAP面向市场 ??数据内容:OLTP系统管理当前数据,而OLAP管理历史的数据。 ??数据库设计:OLTP系统采用实体-联系(ER)模型和面向应用的数据库设计,而OLAP系统通常采用星形和雪花模型 ??视图:OLTP系统主要关注一个企业或部门内部的当前数据,而OLAP 系统主要关注汇总的统一的数据。 ??访问模式:OLTP访问主要有短的原子事务组成,而OLAP系统的访问大部分是只读操作,尽管许多可能是复杂的查询 3 建立数据仓库模型:维与度量 ??星型模型: 中间是事

文档评论(0)

1亿VIP精品文档

相关文档