基于数据仓库的数据挖掘技术资料.pptVIP

  • 0
  • 0
  • 约4.18千字
  • 约 34页
  • 2019-06-14 发布于湖北
  • 举报
基于数据仓库的数据挖掘技术资料

第一章 数据库、数据库管理系统与数据仓库 第1章 数据库、数据库管理系统与数据仓库 1.1 数据库与数据库技术 1.1.1 数据、数据库与数据库系统 1.1.2 数据库系统的特点 1.1.3 数据库技术新发展 1.2 数据仓库 1.2.1 从传统数据库到数据仓库 1.2.2 数据仓库的基本特性 1.3 数据仓库及其数据分析工具 1.3.1 联机分析与数据挖掘 1.3.2 数据仓库与数据挖掘 1.3.3 数据仓库未来发展方向 1.1 数据库与数据库技术 数据库是按一定组织方式存储在计算机存储器中的相互关联的数据集合,数据库的建立独立于程序。数据库管理系统是一个管理数据库的软件系统,它为用户提供了描述数据库、操纵数据库和维护数据库的方法和命令,并且能自动控制数据库的安全以及数据完整。 数据库系统是在文件系统的基础上发展起来的。数据库系统是一个具有管理数据库功能的计算机系统,它包括应用软件、数据库、数据库管理系统和数据库管理人员几部分。 1.1.1 数据、数据库与数据库系统 1.数据(Data) 数据是信息系统的基本概念和计算机系统要处理的基本对象之一。 严格地说,数据可定义为:数据是对客观事物记录下来的、可以鉴别的符号。数据是客 观事物的属性、数量、位置及相互关系等等的抽象表示。 2.数据库(DataBase,DB) 数据库是自描述的,这个描述称作数据字典(或数据目录,或元数据)。 3.数据库系统(DataBase System,DBS) 数据库系统是指在计算机系统中引入数据库后的系统。 4.数据库管理系统 随着计算机软、硬件和相应技术的发展,数据管理经历了人工管理、文件 系统和数据库系统3个阶段。 1.1.2数据库系统的特点 1. 数据的结构化 2. 数据的共享性 3. 数据的独立性 4. 数据统一由DBMS管理和控制 (1)数据的安全性 (2)数据的完整性 (3)并发控制 (4)数据库恢复 1.1.3 数据库技术新发展 1.数据模型:关系数据库与面向对象数据库 (1)关系数据库 用数字来表明自然界的各种事物是按照实体、属性、值进行的。 关系数据库是支持关系模型的数据库系统,而关系模型由关系数据结构、关系操作集合和完整性约束三部分组成。 (2)结构化查询语言SQL SQL是结构化查询语言(Structed Query Language),也被称为Standard Query Language(标准化查询语言)。 SQL有两大突出的特点:一是所有SQL数据库中的数据都存储在表中,一个表有行和列组成。二是这种语言被设计为不允许按照某种特定的顺序来取出,使用SQL只能按查询条件来读取记录。 (3)面向对象数据库 面向对象数据库系统是数据库技术与面向对象程序设计方法相结合的产物。 图1-4 数据库系统 将传统数据库技术与其他学科的内容相结合以开发新型数据库是数据库技术的一个新发展,目前已经发展出一些新型的数据库系统。如:分布式数据库、并行数据库、知识数据库、主动数据库系统、多媒体数据库、模糊数据库。 3.面向应用的数据库 数据库技术被应用于特定领域中时,就出现了数据仓库、工程数据库、统计数据库、空间数据库、科学数据库等多种数据库,使数据库领域的应用范围不断扩大。 1.2.1 从传统数据库到数据仓库 传统数据库在联机事物处理中取得了较大的成功,但在基于事物处理的数据库帮助决策分析时却产生了很大的困难。主要原因是传统数据库的处理方式和决策分析中的数据需求不相称,导致传统数据库无法支持决策分析活动。这些不相称主要体现在如下几个方面: (1).决策处理的系统响应问题 (2).决策数据需求的问题 (3).决策数据操作的问题 (4).数据仓库与传统数据库的比较 1.2.2 数据仓库的基本特性 1.数据仓库的定义 数据仓库就是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合,它用以支持企业或组织的决策分析处理。 表1-1 数据仓库与数据库的对比 2.数据仓库的基本特征 (1)数据仓库的数据是面向主题的 (2)数据仓库的数据是集成的 (3)数据仓库是随时间变化的 (4)数据仓库是不可更新的 1.3.1 联机分析与数据挖掘 1.联机分析处理技术

文档评论(0)

1亿VIP精品文档

相关文档