SPSS数据分析实用教程13 判别分析.pptVIP

下载本文档

17
0
约2.15千字
约 39页
2019-07-18 发布于辽宁
举报

SPSS数据分析实用教程13 判别分析.ppt

SPSS数据分析教程 —《SPSS数据分析教程》第13章判别分析本章要求了解判别分析的基本概念；掌握判别分析的应用范围；了解判别分析的应用条件和限制；了解Fisher判别分析法和Mahalanobis判别分析法；掌握SPSS判别分析的应用。 13.1 判别分析简介在科学试验、疾病诊断、考古、地质勘探、天气预报、社会调查、植物分类等工作中，往往要对当前研究的对象与以前已经得到的资料或者知识进行比较，以便获知该对象是否是我们已经掌握的对象中的某一种。例如：诊断疾病时，把一系列的检测指标与已有的病历进行比较，从而作出具体疾病情况的判断判别分析有多个总体（2个或者更多）或者类别，判别分析是用来对于归属未知的个体进行分类的一种分类方法。它有较为严格的数学理论 Fisher 判别法假设有两个总体G1和G2，其预测变量的取值为，均值为，协方差分别为和和，则能够最大化下式的w值所构成的x的线性组合就能最好的对类进行区分。 Fisher线性判别法示意图两个总体的判别规则如果，样品将被判为一类，否则被判为另一个类，这里马式距离判别法:2个总体利用待判断的个体到各个总体的马式距离的远近来判断其归属。用表示总体1，其均值和协方差矩阵V1已知；用表示总体2，其均值和协方差矩阵V2 已知。马氏距离法判别规则如果，则X被归为类 G1，否则X归为类 G2 逐步判别分析(Step wise) 自变量在判别分类中所起的作用，一般来说是不同的，有些自变量可能起重要作用，有些可能不是很重要。逐步判别法的基本思想是：逐步引入变量，每次引入一个当前“最重要”的变量，同时也检验先前引入的变量，及时将不重要的变量从判别模型中剔除。逐步判别分析的设置判别分析中的假设检验自变量之间的相关性不能太大任何给定的自变量的均值和方差不能有太大的相关性两个自变量之间的相关性在各个组之间是一致的自变量的取值服从正态分布一般应用Box检验来对各个类别的协方差矩阵是否相等进行检验。Box检验的统计量如下：当分组协方差矩阵相等或者近似时，B等于或者接近为0 案例分析：两个总体的判别某图书直销公司大约有50,000名客户的历史购买记录，现在他们想向这些客户推销一本新文艺书。他们首先想从这些客户中找出那些可能会购买这本书的客户，然后向他们发出相关的优惠购买信息。首先从这50000名客户中随机抽取了1000名客户，邮寄给他们购书的优惠券，其中83名客户最终购买了这本书，响应率为8.3%。该公司需要据此信息找出那些可能购买新书的客户的特征，然后向其他可能购买新书的客户发出优惠购买信息。数据情况 books.sav记录了该公司第一次的营销记录 Response：为因变量。表示客户是否购买新书，值为0意味着没有购买；值为1意味着购买。 Months：自变量。记录了客户上次购买距今的月数 Artbooks：自变量。记录客户购买文艺书的册数。 ID：表示记录的编号，分析中用不到该变量。菜单选择选择【分析(A)】→【分类(F)】→【判别(D)】分组变量设置判别分析的分组变量（G）必须是以整数编码的数值类型，同时把其度量水平设为名义数据或者有序数据。 “分组变量(G)”框中的内容显示为”Response(??)”，其后面的“（??）”是提示用户输入需要判别的类别范围 “统计量（S）”选项，分类选择保存选项组统计量组统计量 Response 均值标准差有效的 N（列表状态）未加权的已加权的 0 Months 12.73 8.107 917 917.000 Artbooks .33 .607 917 917.000 1 Months 9.41 5.951 83 83.000 Artbooks 1.00 1.059 83 83.000 合计 Months 12.46 8.001 1000 1000.000 Artbooks .39 .681 1000 1000.000 分类结果-总结（Confusion Matrix) 分类结果a ? Response 预测组成员合计 0 1 初始计数 0 907 10 917 1 72 11 83 % 0 98.9 1.1 100.0 1 86.7 13.3 100.0 a. 已对初始分组案例中的 91.8% 个进行了正确分类。组均值相等的检验汇聚的组内相关性判别式函数两个以上总体的判别—电信客户分类数据文件telco.sav 记录了电信用户的特征。根据用户应用电信业务的情况，

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

SPSS数据分析实用教程13 判别分析.pptVIP