第9章数据库发展新技术.pptVIP

  • 3
  • 0
  • 约1.3万字
  • 约 53页
  • 2016-12-25 发布于重庆
  • 举报
第9章 数据高级处理技术 9.1数据库系统的新发展 9.1.1 新一代数据库系统 1990年,高级DBMS功能委员会发表了《第三代数据库系统宣言》的文章,提出第三代DBMS应具有的3个基本特征。 (1)第三代数据库系统应支持数据管理、对象管理和知识管理。 (2)第三代数据库系统必须保持或继承第二代数据库系统的技术。 (3)第三代数据库系统必须对其他系统开放。 9.1数据库系统的新发展 9.1.2 数据库系统发展的特点 数据库系统的发展主要从数据模型的发展、新技术的发展和应用领域的发展3个方面来讨论。 1.数据模型的发展 (1)对传统的关系模型(1NF)进行扩充,引入了少数构造器,称为复杂数据模型。 (2)增加全新的数据构造器和数据处理语言,以表达复杂的结构和丰富的语义。 (3)将语义数据模型和OO程序设计方法结合起来,提出了面向对象的数据模型。 (4)XML数据模型。 2.新技术的发展 3.应用领域的发展 9.1数据库系统的新发展 9.1.3 数据库系统的发展趋势 数据、应用需求、计算机相关技术这三个因素是推动数据库技术发展的三个主要动力。 1.信息特征和来源的变化 2.应用领域的变化 3.相关技术的发展 4.当前若干研究热点 9.2 数据仓库与联机分析处理技术 9.2.1数据仓库的定义 数据仓库中的数据是面向主题的,每一个主题对应一个宏观的分析领域。数据仓库的集成特征是指数据进入仓库前,必须经过数据加工和集成,从面向应用转变为面向主题。数据仓库的持久性或稳定性是指它所反映的是历史数据的内容,而不是日常事务处理产生的数据,所以进入数据仓库后的数据是极少或根本不修改的。 数据仓库保存不同时间的数据集合,它要求数据仓库中的数据保存时限能满足决策分析的需要,数据仓库的数据都要标明该数据的历史时期。 9.2 数据仓库与联机分析处理技术 9.2.2数据仓库会带来什么好处 数据仓库管理为信息技术人员提供管理数据仓库的功能,可将源数据经过加工处理转换成数据仓库可存储的数据;为了加载各种结构数据,系统提供了数据建模工具及元数据描述,利用这些功能可方便地维护数据仓库。 数据仓库(或数据集市)为存储数据机制。面向企业的所有数据称为数据仓库;面向某个部门或某个主题的数据称为数据集市。 9.2 数据仓库与联机分析处理技术 9.2.3联机事务处理系统与数据仓库的比较 联机分析处理的概念最早由关系数据库之父E·F·Codd于1993年提出的。Codd认为联机事务处理(OLTP)已不能满足终端用户对数据库查询分析的要求,结构化查询语言(SQL)对大数据库的简单查询也不能满足用户分析的需求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此,Codd提出了多维数据库和多维分析的概念,即OLAP。 9.2 数据仓库与联机分析处理技术 数据仓库与OLAP的关系是互补的,现代OLAP系统一般以数据仓库作为基础,即从数据仓库中抽取详细数据的一个子集并经过必要的聚集存储到OLAP存储器中供前端分析工具读取。 显然,为联机数据事务处理(OLTP)而设计的数据库信息系统不能用来管理数据仓库,因为两种系统是按照不同的需求来设计的。如联机事务处理系统要求能够及时地处理大量的日常操作型事务,而数据仓库要求支持启发性的综合查询处理。通常称基于数据仓库的数据分析和决策系统为联机分析处理系统(OLAP)。 9.3 数据挖掘 9.3.1数据挖掘的定义 简单地说,数据挖掘是从大量数据中提取或“挖掘”知识。该术语实际上有点用词不当。注意,从矿石或砂子挖掘黄金称作黄金挖掘,而不是砂石挖掘。这样,数据挖掘应当更正确地命名为“从数据中挖掘知识”,不幸的是它有点长。“知识挖掘”是一个短术语,可能不能强调从大量数据中挖掘。毕竟,挖掘是一个很生动的术语,它抓住了从大量的、未加工的材料中发现少量金块这一过程的特点。这样,这种用词不当携带了“数据”和“挖掘”,成了流行的选择。 许多人把数据挖掘视为另一个常用的术语“数据库中知识发现”或 KDD 的同义词。而另一些人只是把数据挖掘视为数据库中知识发现过程的一个基本步骤。 我们采用数据挖掘的广义观点:数据挖掘是从存放在数据库、数据仓库或其它信息库中的大量数据挖掘有趣知识的过程。 9.3 数据挖掘 9.3.2数据挖掘——在何种数据上进行 原则上讲,数据挖掘可以在任何类型的信息存储上进行。这包括关系数据库、数据仓库、事务数据库、先进的数据库系统、展平的文件和 WWW。 先进的数据库系统包括面向对象和对象-关系数据库;面向特殊应用的数据库,如空间数据库、时间序列数据库、文本数据库和多媒体数据库。挖掘的挑战和技术可能因存储系统而异。 9.4 分布式数据库 9.4.1 分布式数据库概述 分

文档评论(0)

1亿VIP精品文档

相关文档