- 1、本文档共62页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2015/11/6 数据仓库与数据挖掘 53 1.5 数据仓库的产生、发展与未来 三、数据仓库的未来(阅读) ? ? ? 在数据抽取方面,未来的技术发展将集中在系统集成化方面。 它将互连、转换、复制、调度、监控纳入标准化的统一管理, 以适应数据仓库本身或数据源可能的变化,使系统更便于管 理和维护。 在数据管理方面,未来的发展将使数据库厂商明确推出数据 仓库引擎,作为数据仓库服务器产品与数据库服务器并驾齐 驱。在这一方面,带有决策支持扩展的并行关系数据库将最 具发展潜力。 在数据表现方面,数理统计的算法和功能将普遍集成到联机 分析产品中,并与Internet/Web技术紧密结合。按行业应用 特征细化的数据仓库用户前端软件将成为产品作为数据仓库 解决方案的一部分。数据仓库实现过程的方法论将更加普及, 将成为数据库设计的一个明确分支,成为管理信息系统设计 的必备 2012/11/6 数据仓库与数据挖掘 20 举 例 2012/11/6 数据仓库与数据挖掘 21 1.1 数据仓库的概念、特点与组成 三、数据仓库的组成: ? ? ? ? 访问工具; 数据集市(Data Marts):从数据仓库中独立出 来的一部分数据,即部门主题数据。 数据仓库管理; 信息发布系统。 数据挖掘的社会需求 国民经济和社会的信息化 ? 社会信息化后,社会的运转是软件的运转 ? 社会信息化后,社会的历史是数据的历史 1.2 数据挖掘的概念与方法 2012/11/6 数据仓库与数据挖掘 23 1.2 数据挖掘的概念与方法 一、概念 ? 数据挖掘(Data Mining),就是从大量数据中获 取有效的、新颖的、潜在有用的、最终可理解 的模式的非平凡过程,简单的说,数据挖掘就 是从大量数据中提取或“挖掘”知识,又被称 为数据库中的知识发现(Knowledge Discovery in Database, KDD) 。 2012/11/6 数据仓库与数据挖掘 24 1.2 数据挖掘的概念与方法 一、概念 ? ? 数据挖掘是从数据中自动地抽取模式、关联、 变化、异常和有意义的结构; 数据挖掘大部分的价值在于利用数据挖掘技术 改善预测模型。 2012/11/6 数据仓库与数据挖掘 25 1.2 数据挖掘的概念与方法 二、数据挖掘的方法: ? ? 直接数据挖掘 间接数据挖掘 2012/11/6 数据仓库与数据挖掘 26 1.2 数据挖掘的概念与方法 三、数据仓库与数据挖掘的关系 ? ? 若将数据仓库(Data Warehouse)比作矿井, 那么数据挖掘(Data Mining)就是深入矿井 采矿的工作 数据挖掘是从数据仓库中找出有用信息的一种 过程与技术 2012/11/6 数据仓库与数据挖掘 27 1.3 数据仓库的技术、方法与产品 一、联机事务处理(OLTP)与 联机分析处理(OLAP)的比较 日常事务处理 负责的分析操作, 侧重决策支持 2012/11/6 数据仓库与数据挖掘 29 1.3 数据仓库的技术、方法与产品 二、联机分析处理(OLAP)有关概念 ? ? ? 维:人们观察数据的特定角度,从不同维属性上的数 据进行研究。例如,企业常常关心不同销售数据随 时间的变化情况,所以时间就是一个维 多维数据集 度量值:描述了要分析的数值,例如话费、用户数 量等; Country 数据立方体样本 全年度美国电视机 的销售量 sum TV PC VCR sum 1Qtr 2Qtr Date 3Qtr 4Qtr U.S.A Canada Mexico sum 2012/11/6 数据仓库与数据挖掘 30 1.3 数据仓库的技术、方法与产品 二、联机分析处理(OLAP)有关概念 多维分析: OLAP对数据仓库中数据的操作是针对多维数据视 图(又称为超立方体)进行的。对立方体的典型操作包括 :切片、切块以及旋转等。 1. 上卷(上钻): 数据的汇总 ? 通过一个维的概念分层向上攀升或者通过维归约来实现 2. 下钻 (下卷): 上卷的逆操作 ? 通过沿维的概念分层由高粒度向下下钻到低粒度的层次或者通过引 入新的维来实现 3. 4. 5. 切片 切块 旋转 选定多维数组的一个二维子集; 选定多维数组的一个三维子集; 改变一个立方体显示的维方向, 切片 切块 旋转 地 域 地域 产 品 年份 图2.1 对超立方体的典型
文档评论(0)