数据挖掘每章知识(同名).doc

数据挖掘每章知识(同名).doc

第一章? 1.数据挖掘定义:从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。? 2.不能在原数据库上做决策而要建造数据仓库的原因:传统数据库的处理方式和决策分析中的数据需求不相称,主要表现在:⑴决策处理的系统响应问题⑵决策数据需求的问题⑶决策数据操作的问题?????? 3.数据仓库的定义? W.H.Inmon的定义:数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策。? 公认的数据仓库概念基本上采用了W.H.Inmon的定义:数据仓库是面向主题的、集成的、不可更新的(稳定性)随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程。?? 数据仓库与数据挖掘的关系: ⑴数据仓库系统的数据可以作为数据挖掘的数据源。数据仓库系统能够满足数据挖掘技术对数据环境的要求,可以直接作为数据挖掘的数据源。⑵数据挖掘的数据源不一定必须是数据仓库系统。数据挖掘的数据源不一定必须是数据仓库,可以是任何数据文件或格式,但必须事先进行数据预处理,处理成适合数据挖掘的数据。 ?5.?数据挖掘的功能——7个方面:? ⑴概念描述:对某类对象的内涵进行描述,并概括这类对象的有关特征。①特征性描述②区别性描述? ⑵关联分析:若两个或多个变量间存在着某种规律性,就称为关联。关联分析的目的就是找出

文档评论(0)

1亿VIP精品文档

相关文档