多元统计课件:判别分析.pptx

多元统计课件:判别分析.pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共51页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

;

;

§4.1;

判别分析的假设之一,是每一个判别变量(解释变量)不能是其他判别变量的线性组合。即不存在多重共线性问题。判别分析的假设之二,是各组变量的协方差矩阵相等。判别分析最简单和最常用的形式是采用线性判别函数,它们是判别变量的简单线性组合。在各组协方差矩阵相等的假设条件下,可以使用很简单的公式来计算判别函数和进行显著性检验。;

§4.2;

§4.2;

§4.2;

§4.2;

§4.2;

§4.2;

§4.2;

§4.2;

§4.2;

§4.3Bayes判别;

§4.3Bayes判别;

§4.4Fisher判别;

§4.4Fisher判别;

§4.4Fisher判别;

§4.4Fisher判别;

§4.4Fisher判别;

§4.5;

§4.5;

§4.5;

§4.5;

§4.6判别分析应用的几个例子判别分析的逻辑框图如下:;

;

?下面用SPSS软件中的Discriminant模块来实现判别分析。;

定义新的变量y为被解释变量,用“1”代表Setosa鸢尾花,用“2”代表Versicolor鸢尾花,用“3”代表Virginica鸢尾花,将萼片长(sepallength)、萼片宽(sepalwidth)、花瓣长(petallength)和花瓣宽(petalwidth)四个变量作为解释变量。

使用SPSS软件中的Analyze→Classify→Discriminant,就进入了判别分析的对话框。分组变量(GroupingVariable)选择y,然后定义其区域,最小值是1,最大值是3。解释变量(Independents)选择sepal.length,sepal.width,petal.length和petal.width。;

?保存(Save)选项中可以选择预测的分类、判别得分以及所属类别的概率。如果采用逐步判别法,我们还可以选择判别的方法(Method)。得到分析结果如下(见输出结果4—1)。;

?;

?输出结果4—2是对各组协方差矩阵是否相等的Box’sM检验。第1张表反映协方差矩阵的秩和行列式的对数值。由行列式值可以看出,协方差矩阵不是病态矩阵。第2张表是对各总体协方差阵是否相等的统计检验。由F值及其显著水平,我们在0.05的显著性水平下拒绝原假设(原假设假定各总体协方差阵相等)。因此,在分类(Classify)选项中的协方差矩阵选择可以考虑采用Separate-groups,以检验采用Within-groups和Separate-groups两种协方差所得出的结果是否存在显著差异。如果存在显著差异,就应该采用Separate-groups协方差矩阵;反之,就用Within-groups协方差矩阵。;

***;

?我们可以根据这个判别函数计算每个观测的判别Z得分。第4张表是反映判别函数在各组的重心。根据结果,判别函数在y=1这一组的重心为(-7.608,0.215),在y=2这一组的重心为(1.825,-0.728),在y=3这一组的重心为(5.783,0.513)。这样,我们就可以根据每个观测的判别Z得分对观测进行分类。;

?;

?我们可以计算出每个观测在各组的分类函数值,然后将观测分类到较大的分类函数值中。第4张表是分类矩阵表。PredictedGroupMembership表示预测的所属组关系,Original表示原始数据的所属组关系,Cross-validated表示交叉验证的所属组关系,这里交叉验证是采用“留一个在外”的原则,即每个观测是通过除了这个观测以外的其他观测推导出来的判别函数来分类的。由第4张表可以看出,通过判别函数预测,有147个观测是分类正确的,其中,y=1组50个观测全部被判对,y=2组50个观测中有48个观测被判对,y=3组50个观测中有49个观测被判对,从而有147/150=98%的原始观测被判对。在交叉验证中,y=1组50个观测全部被判对,y=2组50个观测中有48个观测被判对,y=3组50个观测中有49个观测被判对,从而交叉验证有147/150=98%的原始观测被判对。还可以通过分类结果分析判对和判错的百分比。最后为分类结果图,从图中可以看到,Setosa鸢尾花与Versicolor鸢尾花和Virginica鸢尾花可以很清晰地区分开,而Versicolor鸢尾花和Virginica鸢尾花这两种之间存在重合区域,即存在误判。;

?我们还可以通过保存(Save)选项选择预测的类别关系和判别得分等,对观测进行诊断。;

由输出结果4—6的表(1)可以看出,通过判别函数预测,有146个观测是分类正确的,其中,y=1组50个观测全部被判对,y=2组50

文档评论(0)

ning2021 + 关注
实名认证
内容提供者

中医资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年05月10日上传了中医资格证

1亿VIP精品文档

相关文档