《数据仓库与数据挖掘》演示稿第4章.ppt

复旦大学 软件学院 2004.04 第4章 数据仓库系统的体系结构与设计方法 数据仓库系统的体系结构 分布式对象技术 监控器的设计 转换器的设计 集成器的设计 元数据管理器的设计 数据仓库系统的体系结构 数据仓库系统的体系结构 源数据:数据仓库中的数据来源于多个数据源,它不仅可以是企业内部的关系型数据库,还包括非传统数据,如文件、HTML文档等。 数据仓库管理系统: 元数据库及元数据管理部件:元数据库用来存储由定义部件生成的关于源数据、目标数据、提取规则、转换规则以及源数据与数据仓库之间的映射信息等。 数据转换部件:该部件把数据从源数据中提取出来,依定义部件的规则将不同数据格式的源数据转换成数据仓库的数据格式并装载进数据仓库。 数据集成部件:该部件根据定义部件的规则、统一各源数据的编码规则,并净化数据,根据元数据中定义的数据组织形式对数据进行汇总、聚合计算。 数据仓库管理部件:它主要用于维护数据仓库中的数据,备份、恢复数据以及管理数据的安全权限问题。 数据仓库系统的体系结构 数据仓库前端工具集 查询/报表工具:以图形化方式和报表方式显示数据,帮助了解数据的结构、关系以及动态性。 OLAP工具:通过对信息的多种可能的观察形式进行快速、一致和交互性的存取,便于用户对数据进行深入的分析和观察。 数据挖掘工具:从大量数据中挖掘出具有规律性的知识,以及数据之间的内在联系。 前端开

文档评论(0)

1亿VIP精品文档

相关文档