SPSS数据分析实用教程13 判别分析.pptVIP

  • 17
  • 0
  • 约2.15千字
  • 约 39页
  • 2019-07-18 发布于辽宁
  • 举报
SPSS数据分析教程 —《SPSS数据分析教程》 第13章判别分析 本章要求 了解判别分析的基本概念; 掌握判别分析的应用范围; 了解判别分析的应用条件和限制; 了解Fisher判别分析法和Mahalanobis判别分析法; 掌握SPSS判别分析的应用。 13.1 判别分析简介 在科学试验、疾病诊断、考古、地质勘探、天气预报、社会调查、植物分类等工作中,往往要对当前研究的对象与以前已经得到的资料或者知识进行比较,以便获知该对象是否是我们已经掌握的对象中的某一种。 例如: 诊断疾病时,把一系列的检测指标与已有的病历进行比较,从而作出具体疾病情况的判断 判别分析 有多个总体(2个或者更多)或者类别,判别分析是用来对于归属未知的个体进行分类的一种分类方法。 它有较为严格的数学理论 Fisher 判别法 假设有两个总体G1和G2,其预测变量的取值为 ,均值为 ,协方差分别为 和 和 ,则能够最大化下式的w值所构成的x的线性组合就能最好的对类进行区分。 Fisher线性判别法示意图 两个总体的判别规则 如果 ,样品将被判为一类,否则被判为另一个类,这里 马式距离判别法:2个总体 利用待判断的个体到各个总体的马式距离的远近来判断其归属。 用 表示总体1,其均值 和协方差矩阵V1已知;用 表示总体2,其均值 和协方差矩阵V2 已知。 马氏距离法判别规则 如果 ,则X被归为类 G1,否则X归为类 G2 逐步判别分析(Step wise) 自变量在判别分类中所起的作用,一般来说是不同的,有些自变量可能起重要作用,有些可能不是很重要。 逐步判别法的基本思想是:逐步引入变量,每次引入一个当前“最重要”的变量,同时也检验先前引入的变量,及时将不重要的变量从判别模型中剔除。 逐步判别分析的设置 判别分析中的假设检验 自变量之间的相关性不能太大 任何给定的自变量的均值和方差不能有太大的相关性 两个自变量之间的相关性在各个组之间是一致的 自变量的取值服从正态分布 一般应用Box检验来对各个类别的协方差矩阵是否相等进行检验。Box检验的统计量如下: 当分组协方差矩阵相等或者近似时,B等于或者接近为0 案例分析:两个总体的判别 某图书直销公司大约有50,000名客户的历史购买记录,现在他们想向这些客户推销一本新文艺书。他们首先想从这些客户中找出那些可能会购买这本书的客户,然后向他们发出相关的优惠购买信息。首先从这50000名客户中随机抽取了1000名客户,邮寄给他们购书的优惠券,其中83名客户最终购买了这本书,响应率为8.3%。该公司需要据此信息找出那些可能购买新书的客户的特征,然后向其他可能购买新书的客户发出优惠购买信息。 数据情况 books.sav记录了该公司第一次的营销记录 Response:为因变量。表示客户是否购买新书,值为0意味着没有购买;值为1意味着购买。 Months:自变量。记录了客户上次购买距今的月数 Artbooks:自变量。记录客户购买文艺书的册数。 ID:表示记录的编号,分析中用不到该变量。 菜单选择 选择【分析(A)】→【分类(F)】→【判别(D)】 分组变量设置 判别分析的分组变量(G)必须是以整数编码的数值类型,同时把其度量水平设为名义数据或者有序数据。 “分组变量(G)”框中的内容显示为”Response(??)”,其后面的“(??)”是提示用户输入需要判别的类别范围 “统计量(S)”选项, 分类选择 保存选项 组统计量 组统计量 Response 均值 标准差 有效的 N(列表状态) 未加权的 已加权的 0 Months 12.73 8.107 917 917.000 Artbooks .33 .607 917 917.000 1 Months 9.41 5.951 83 83.000 Artbooks 1.00 1.059 83 83.000 合计 Months 12.46 8.001 1000 1000.000 Artbooks .39 .681 1000 1000.000 分类结果-总结(Confusion Matrix) 分类结果a ? Response 预测组成员 合计 0 1 初始 计数 0 907 10 917 1 72 11 83 % 0 98.9 1.1 100.0 1 86.7 13.3 100.0 a. 已对初始分组案例中的 91.8% 个进行了正确分类。 组均值相等的检验 汇聚的组内相关性 判别式函数 两个以上总体的判别—电信客户分类 数据文件telco.sav 记录了电信用户的特征。根据用户应用电信业务的情况,

文档评论(0)

1亿VIP精品文档

相关文档