数据挖掘读书笔记.docxVIP

  • 35
  • 0
  • 约1.26千字
  • 约 3页
  • 2017-05-19 发布于重庆
  • 举报
数据挖掘读书笔记

《数据挖掘:概念与技术》(1-6章)读书笔记数据挖掘概念(即什么是数据挖掘)我们生活在数据时代,各行各业每天都产生巨大的数据。数据的爆炸式增长、广泛可用和巨大数量使得我们的时代成为真正的数据时代。急需功能强大和通用的工具,以便从海量数据中发现有价值的信息,把这些数据转换成有组织的、可利用的知识。这种需求导致了数据挖掘的诞生。数据挖掘实际上是从数据中挖掘知识,由以下步骤的迭代组成:数据清理(消除噪声和删除不一致数据)数据集成(多种数据源可以组合在一起)数据选择(从数据库中提取与分析任务相关的数据)数据变换(通过汇总或聚集操作,把数据变换和统一成适合挖掘的形式)数据挖掘(基本步骤,使用智能方法提取数据模式)模式评估(根据某种兴趣度度量,识别代表知识的真正有趣的模式)知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)关系数据库是数据挖掘最常见、最丰富的信息源,因此它是我们数据挖掘研究研究的一种主要数据形式。数据挖掘技术(即怎样进行数据挖掘)可以挖掘什么类型的模式特征化与区分、频繁模式、关联和相关性挖掘,分类与回归,聚类分析,离群点分析。数据挖掘可以被用来进行市场分析和管理、风险分析和管理、缺陷分析和管理等。2、使用什么技术1)首先要认识数据,一个数据对象代表一个实体,又称样本、实例、数据点或对象。?属性是一个数据字段,表示数据对象的一个特征,又称维、特征和变量。2)数据描述中心趋

文档评论(0)

1亿VIP精品文档

相关文档