- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第06节-数据库跟数据仓库技术
* * * * * * * * * * * * * * * * * * * * * * 6.4.1 数据仓库 数据仓库之父W.H.Inmon :“数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrated)、非易失的(Non-Volatile)、随时间变化的(Time Variant)的数据集合,用于支持管理决策”。 ? 图6-15 数据仓库源于业务数据库 6.4.2 联机分析处理 联机分析处理(On-Line Analytical Processing,OLAP):主要是对大量多维数据的动态综合、分析和归纳。 OLAP中的一个主要操作是“多维分析”,即通过对信息的多种可能的观察形式进行快速、稳定、一致和交互性的存取,允许管理决策人员对数据进行深入分析。 ? 图6-16 多维视图示例 切片和切块 (Slice and Dice) 钻取(Drill) 旋转(Rotate)/转轴(Pivot) 从OLTP到OLAP OLAP和数据仓库 OLAP应用构建于数据仓库而非数据库之上,主要是由于以下三个技术方面的原因 : 计算机处理速度阶跃式增长,单位字节的存储和处理成本大幅度降低,是保证数据仓库有效运行的物理基础; 决策分析理论的完善和应用使得数据仓库中的分析技术能够有效实现,使得决策人员可以直接从系统中获得需要的决策支持信息; 数据仓库系统中,数据用于支持各种分析任务,并生成多角度,多层次和不同粒度上的分析结果. OLAP中的基本概念 ⑴ 变量:从现实系统中抽象出来,用于描述数据的实际含义。 维:人们观察数据的特定角度 维的层次 类别:构成一个维的独立的数据元素,是存在于层里每一个数据。 维、层和类别的关系示意图 OLAP中的基本概念 ⑵ 维的取值:也称为维的成员 度量:企业收集和存储的用于评价业务状况的数值性数据,以监测和评估企业成效。 多维数组 数据单元(单元格) 多维数组的取值称为数据单元 多维数据立方体 OLAP的基本操作 -切片(Slice) 在多维数组的某一维上选定其维成员的动作称为切片 在多维数组(维1,维2,…维n,度量)中选中某一维,如维i,并取其某一维成员(设为维成员Vi),所得的多维数组的子集(维1,维2,…维成员Vi,…维n,度量)称为在维i上的一个切片。 OLAP的基本操作 -切块(Dice) 数据切块就是将完整的数据立方体切取一部分数据而得到的新的数据立方体。 选取多维数组(维1,维2,…,维n,度量)中若干维度(通常是3个维度便于图形显示)的取值范围,从而形成了多维数据的子集(维1,维2,…,Ai 维i Bi,…,Bj 维j Bj,…,维度n,度量),这个多维数据子集被称为切块。 OLAP的基本操作 - 下钻/上卷(Drill Down/Roll Up) 数据下钻(向下钻取)是从较高的维度层次下降到较低的层次上来观察多维数据 数据上卷是下钻的逆向操作,是对数据进行高层次聚合的操作。 OLAP的基本操作 -旋转(Rotate) 数据旋转是改变维度的位置关系,使最终用户可以从其他视角来观察多维数据。 不同维度间的旋转 维层次间的旋转 OLAP的准则(Codd 1993) 准则1:多维概念视图 准则2:透明性 准则3:存取能力 准则4:稳定的报表功能 准则5:客户机/服务器体系结构 准则6:维的等同性 准则7:动态稀疏矩阵处理 准则8:支持多用户 准则9:非限定的跨维操作 准则10:直观的数据处理 准则11:柔性报表 准则12:不受限的维与层次聚类 6.4.3 商业智能 商业智能(Business Intelligence)是指通过对数据的收集、管理、分析以及转化,使数据成为可用的信息,并在企业中共享传递,从而帮助企业获得必要的洞察力和理解力,更好地辅助决策和指导行动。 6.4.4 数据挖掘 数据挖掘(Data Mining)是从大量数据中自动发现隐藏的有用知识的过程,是从大量数据中挖掘“宝藏”的过程。 分类(Classification) 聚类(Clustering) 关联规则发现(Association Rule Discovery) 时序模式发现(Sequential Pattern Discovery) 商务智能、多维数据分析和数据挖掘 博彩业的Harrahs(哈拉斯)借助于商业智能,判断高价值客户,并制定鼓励他们更多投资的方案 通过联系分析处理(OLAP)和多维数据分析,用户可以不同方法分析同一数据,从而得到对该数据从不同层面进行解释的结果 商务智能 知识发现、数据挖掘与商务智能 20世纪80年代末,机器学习方法在数据分析中的应用导致数据库知识发现(KDD,Knowledge
原创力文档


文档评论(0)