数据挖掘概念与技术.ppt

数据挖掘概念与技术创新

* 数据挖掘概念与技术 经济与工商管理学院 邓克文 二零零九年九月 第一课 分类 一、数据挖掘及知识的定义   1、数据挖掘定义:从大量数据中提取或“挖掘”知识;   2、数据挖掘技术:分类、预测、关联和聚类等;   3、数据挖掘过程:数据的清理、集成、选择、变换、挖掘、模型评估、知识表示;   4、知识定义:知识就是“压缩”-浓缩就是精华!     1)Occam Razor:因不宜超出果之需!     2)信息论:熵     3)MDL准则:minimum description length 第一课 分类 二、神经网络知识预备   1、单层神经网络;        2、多层神经网络。 第一课 分类 三、SPSS软件及Logistic回归知识预备   1、回归方法分类 多个因变量 (y1,y2,…yk) 路径分析 结构方程模型分析 一个因变量 y 连续型因变量 (y) --- 线性回归分析 分类型因变量 (y) ---Logistic 回归分析 时间序列因变量 (t) ---时间序列分析 生存时间因变量 (t) ---生存风险回归分析 第一课 分类 三、SPSS软件及Logistic回归知识预备   2、回归方法适用前提    1)大样本,样本量为自变量个数的20倍左右;    2)因变量或其数学变换与自变量有线性关系;    3)扰动项(误

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档