08《数据库》第八章数据库技术新发展.ppt

08《数据库》第八章数据库技术新发展.ppt

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
工程数据库的数据模型 扩展的关系数据模型 对象数据模型 语义数据模型:利用实体、联系、和约束得来描述现实世界的静态、动态和视台特征。具有较高的抽象层次和较强的语义表达。 设计方案的版本p178 在设计过程中产生多个不同的方案,每个设计方案就是一个版本。 每个方案都具有很高的参考价值。因此需要管理。 版本因包含的信息: 设计信息 对象与版本的关联信息。 版本标识信息 附加的版本管理信息。 版本管理 线性版本管理模型 树型版本管理模型 有向无环版本管理模型 九、数据仓库 基本概念 ⑴ 数据仓库的定义 数据仓库Data Warehouse-DW:是面向主题的、集成的、稳定的,并且时变地收集不同数据的一种数据集合的结构形式,用以支持经营管理中的决策制定过程。 面向主题:数据仓库中的数据是面向主题的,而传统数据库是面向应用的。主题是在较高层次将数据归类的标准,每个主题对应一个宏观分析领域。 集成特性:数据仓库的集成特性是指在数据进入数据仓库之前,必须经过转换、加工和集成,或称“整合”处理。这是建立数据仓库的关键步骤。首先要解决原始数据的一致性,消除矛盾,使数据完整、统一;其次还要把面向应用的原始数据结构转变为面向主题的。 稳定性:数据仓库反映的是历史性的数据内容,而不是日常事务处理产生的数据,经加工和集成进入数据仓库后,基本上不再修改。在一次数据分析的执行过程中使用的数据不得变更,这样才能保证两次使用同一组信息进行分析时不会得出不同的答案。 不同时间的集合:要求数据仓库是不同时间的数据集合,这种数据保存的时限能满足进行决策分析的要求,而且在数据仓库中要标明这些数据的历史时期。 数据仓库系统的组成 数据仓库DW 组成 事实表:存储历史商务数据的表。通常不更新。 维表:用于提炼事实表中所包含的数据。减少了对事实表扫描的数据量,提高了查询性能。维表中的数据常需更新 模式 星型模式 雪花模式 数据仓库管理系统 对数据仓库进行数据建模。 确定从源数据到数据仓库的数据抽取、转换和装载等。 确定数据仓库的存储方式。 管理数据的安全、归档、维护、备份、恢复等工作。 分析工具 用户查询工具 C/S检索工具 OLAP分析工具 数据挖掘(DM)工具(Data Mining) DW查询系统 特点 报表杳询:从DW中产生各种业务报表,一般为多表联接、累计、分类、排序等。 随机、动态查询:根据上次查询结果,进行进一步的查询,又称为DM。 共同特点:数据量大、查询速度受到限制。 应考虑的问题: 数据仓库中数据库的可扩展能力。 系统的并发查询处理能力。 OLAP OLTP和OLAP的区别 联机事务处理OLTP系统,它是事件驱动、面向应用的。 联机分析处理OLAP系统,是基于DW的信息分析与处理过程,OLAP是跨部门的、面向主题的。 OLTP和OLAP的区别 OLTP 分析型 细节的 综合的 操作需求事先可知道 操作需求事先不知道 对性能要求高 对性能要求宽松 一个时刻操作一个单元 一个时刻操作一个集合 事务驱动 分析驱动 一次操作数据量小 一次操作数据量大 支持日常操作 支持管理决策需求 OLAP的基本概念 变量: 是决策者所关心的具有实际意义的数量。 维:人们观察数据的特定角度。如:时间、地区等 维的层次:观察数据的某个特定角度的不同细节程度的方面。例:时间维中的日期、月份、季度、年度等 维成员:维的一个取值。例如:某年某月 多维数组:可表示为(维1,维2,…,维n,变量),例如:日用品的销售数据按地区、时间和销售渠道组织起来的三维立方体,加上变量“销售量” 多维分析: 指对以多维方式组织起来的数据采取切片,切块、旋转、钻入、归并等各种分析动作,是分析者、决策者能从多个角度、多个侧面观察数据。 切片:选定多维数组的一个二维子集的动作。 切块:选定多维数组的一个三维子集的动作。 旋转:改变一个报告或页面显示的维方向。 钻入:对结果数据的下一层数据进行剖析。 归并:是钻入的反向处理。 数据挖掘DM 1、数据挖掘的定义 数据挖掘,Data Mining, 就是从大型数据库中的数据中提取人们感兴趣的知识。MD与KDD(Knowledge discovery in database) 有很大的重合度,一般在AI领域称KDD。 2、数据挖掘的目的 发现大量数据中尚未发现的知识,是系统内部自动获取知识的过程 学会方法:OLAP、OLTP等 3、 DM的相关领域 归纳学习(inductive learning) 机器学习(machine learning),关系最为密切 统计(statistics)分析 4、决策支持空间 数据空间(data space):处理基于关键字的查询,如OLTP 聚合空间(aggregation space):数据空间 聚合运算(su

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档