- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库理论学习笔记
数据仓库的基本数据模式 雪花模式(Snowflake Schema) 维一般是由若干层次组成 把维按其层次结构表示成若干个表 规范化、节省存储空间 但需多做连接操作 数据仓库的解决方案 通用的关系数据库系统 专门的数据仓库服务器 数据仓库系统的体系结构 数据仓库层 数据仓库工具层 最终用户 数据仓库系统 数据仓库 居系统的核心地位 是信息挖掘的基础 数据仓库管理系统 是整个系统的引擎 负责管理整个系统的运转 数据仓库工具 一般的查询工具、功能强大的分析工具 是整个系统发挥作用的关键 数据仓库系统 一个集成化的产品集 数据仓库系统 Design Warehouse Architect Manage Sybase ASIQ Integrate Informatica Enterprise Connect Replication Server PowerMart Visualize Brio Cognos Administer Warehouse Control Center Warehouse Control Centre 数据分析模型 早期 静态数据值的相互比较 需求 从多个不同的数据源中综合数据 从不同的角度观察数据 多变的主题、多维数据 E-R不能完全支持 四种分析模型(Codd) 绝对模型 静态数据分析 只能对历史数据进行值的比较,描述基本事实 用户交互少 解释模型 思考模型 公式模型 四种分析模型(Codd) 绝对模型 解释模型 静态数据分析 在当前多维视图的基础上找出事件发生的原因 思考模型 公式模型 四种分析模型(Codd) 绝对模型 解释模型 思考模型 动态数据分析 多维分析 在决策者的参与下,找出关键变量 需要高级数据分析人员的介入 公式模型 四种分析模型(Codd) 绝对模型 解释模型 思考模型 公式模型 动态性最高的一类 自动完成变量的引入工作 数据仓库系统的工具层 查询工具 主要是对分析结果的查询 很少有对记录级数据的查询 验证型工具 多维分析工具 用户首先提出假设,然后利用各种工具通过反复、递归的检索查询以验证或否定假设 发掘型工具 从大量数据中发现数据模式 预测趋势和行为 联机分析处理——OLAP 是针对特定问题的联机访问和分析。 通过对信息的很多种可能的观察形式进行快速、稳定一致和交互性的存取,允许分析人员对数据进行深入观察 一些概念 变量是数据的实际意义,描述数据是什么 维是人们观察数据的特定角度 维的层次是维在不同细节程度的描述 维成员是维的一个取值 多层次维的维成员是各层次取值的组合 对应一个数据项,维成员是该数据项在该维中位置的描述 多维数组可以表示为(维1,维2,……,变量),如(地区,时间,销售渠道,销售额) 多维数组的取值称为数据单元(单元格) 可以理解为交叉表的数据格 一些基本操作 在多维数组的某一维选定一个维成员的动作称为切片。 舍弃一些观察角度 在多维数组的某一维上选定某一区间的维成员切块 多个切片的叠加 旋转是改变一个报告或页面显示的维方向 以用户容易理解的角度来观察数据 基于多维数据库的OLAP——MOLAP 以多维方式组织数据(综合数据) 以多维方式显示(观察)数据 多维数据库的形式类似于交叉表,可直观地表述一对多、多对多的关系 如:产品、地区、销售额 关系 多维 多维数据库由许多经压缩的、类似于数组的对象构成,带有高度压缩的索引及指针结构 以关系数据库存放细节数据、以多维数据库存放综合数据 基于关系数据库的OLAP——ROLAP 以二维表与多维联系来表达多维数据(综合数据) 星型结构 事实表,存储事实的量及各维的码值(BCNF) 维表,对每一个维,至少有一个表用来保存该维的元数据(多层次、冗余) 事实表通过外键与每个维表相联系 雪花、星座、雪暴 模拟多维方式显示(观察)数据 MOLAP与ROLAP MOLAP 计算速度较快 支持的数据容量较小 缺乏细节数据的OLAP ROLAP 结构较复杂 以关系模拟多维 支持适当细节的OLAP 较成熟 HOLAP是以上两种的综合 桌面级工具 BrioQuery (ROLAP) Business Objects (ROLAP) Cognos Impromptu (ROLAP) Cognos PowerPlay (MOLAP) 服务器级OLAP Arbor Software Essbase (MOLAP) MicroStrategy DSS Agent (ROLAP ) Oracle’s Express (hybrid MOLAP/ROLAP) SQL3对聚集的扩展(在Group By中扩展) SP(S#,P#,QTY) S# P# QTY S1 P1 300 S1 P2 200 S2 P1 300 S2 P2 400 S3 P2
您可能关注的文档
- 集装箱码头数据仓库的设计跟实现.doc
- 开源bi平台openi的开发数据仓库系统.doc
- 青岛xx数据仓库项目总体规划建议书(doc 9页).doc
- 青岛华夏数据仓库项目总体规划建议书.doc
- 如何构建银行数据仓库.doc
- 如何构建银行数据仓库doc10.doc
- 如何在数据仓库中使用office-techneteve.ppt
- 商业银行数据仓库报表设计.doc
- 省医数据仓库运用介绍.ppt
- 数据仓库、数据挖掘跟商业智能bi.ppt
- 初中英语人教版七年级上册第四单元Where is my schoolbag ! Section A .ppt
- 初中英语人教版七年级上册第四单元Where is my schoolbag Section B 2.ppt
- 初中英语人教版七年级下册 Unit 6 I'm watching TV. Section A 11a.pptx
- 注册土木工程师培训课件.ppt
- 初中生物济南版七年级上册第一章奇妙的生命现象 第三节生物学的探究方法.ppt
- 初中英语人教版七年级上册第四单元Where is my schoolbag Section B 2.pptx
- 注册安全工程师案例课件.ppt
- 初中物理人教版八年级上册第二章第4节噪声的危害和控制课件(共19张PPT).pptx
- 注册安全工程师王阳课件.ppt
- 初中数学青岛版八年级上2.4《线段的垂直平分线》课件(16张PPT).ppt
原创力文档


文档评论(0)