数据挖掘(偶然看到比较好)02681.ppt

自动化前沿;主要内容 ;一、数据挖掘概述;数据挖掘概念;数据挖掘与KDD;数据挖掘的社会需求;数据挖掘的社会需求;数据挖掘的社会需求;数据挖掘的发展;数据挖掘技术;异常检测;什么是异常(outlier)?;异常检测方法的分类;数据挖掘系统的特征;数据的特征;系统的特征;知识(模式)的特征;知识表示:规则;知识表示:分类树;数据挖掘算法的特征;数据挖掘的主要方法;数据挖掘系统;数据挖掘系统;数据挖掘系统;二、数据预处理;为什么需要预处理;污染数据形成的原因;数据清理的重要性;数据清理处理内容;数据规约;空缺值;噪声数据;分箱;聚类;回归;数据集成;数据变换;最小 最大规范化 小数定标规范化 属性构造 由给定的属性构造和添加新的属性,以帮助提高精度和对高维数据结构的理解 ;数据立方体聚集;维规约;数据压缩;数值规约;数值规约 ;离散化和概念分层;数值数据离散化;分类数据的概念分层生成;三、数据挖掘算法 -分类与预测;分类 VS. 预测;数据分类:两步过程;第一步:建立模型;第二步:用模型进行分类;准备分类和预测的数据;比较分类方法;用判定树归纳分类;判定归纳树算法;贝叶斯分类;后向传播分类;其他分类方法;什么是预测?;回归方法;评估分类法的准确性;提高分类法的准确性;四、数据挖掘算法-聚类;聚类分析;什么是聚类分析?;聚类的常规应用 ;应用聚类分析的例子;聚类方法性能评价;聚类方法性能

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档