数据挖掘与数据仓库 知识点总结.pdfVIP

  • 2
  • 0
  • 约1.49万字
  • 约 7页
  • 2026-06-13 发布于河北
  • 举报

1、数据仓库定义:数据仓库是一种新的数据处理体系结构,它与组织机构的操作数据库分别维护,允

将各种应用系统一起,为统一的历史数据分析提供坚实的平台,对信息处理提供支持。数据仓库是面

向主题的、集成的、相对稳定的、反映历史变化的数据集合,为企业决策支持系统提供所需的集成信息。

设计和构造步骤:1选)取待建模的商务处理;2)选取商务处理的粒变;3)选取用于每•个事实表记录

的维;4)选取事实表中每条记录的变量

系统结构:1()底层是仓库数据服务器,总是关系数据库系统。2()中间层是OLAP服务器,有ROLAP

和MOLAP,它将对多维数据的操作映射为标准的关系课作3()顶层是前端客户端,它包括查询和报表

工具、分析工具和数据挖掘工具

2、数据仓库的多维数据模型:1()星形模式:在此模型下,数据仓库包括一个大的包含大批数据并且不

含冗余的中心表,一组小的附属表,维表环绕中心事实表显示的射线上。特征:星型模型四周的实体是

维度实体,其作用是限制和过滤用户的查询结果,缩小访问范围。每一个维表都有自己的属性,维表和

事实表通过关键字相关联,【例子:sales数据仓库的星形模式,此模式包含一个中心事实表sales,它包

含四个维time,item,

文档评论(0)

1亿VIP精品文档

相关文档