多元统计课件:判别分析.pptxVIP

多元统计课件:判别分析.pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共51页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
; ; §4.1; 判别分析的假设之一,是每一个判别变量(解释变量)不 能是其他判别变量的线性组合。即不存在多重共线性问题。 判别分析的假设之二,是各组变量的协方差矩阵相等。判 别分析最简单和最常用的形式是采用线性判别函数,它们 是判别变量的简单线性组合。在各组协方差矩阵相等的假 设条件下,可以使用很简单的公式来计算判别函数和进行 显著性检验。; §4.2; §4.2; §4.2; §4.2; §4.2; §4.2; §4.2; §4.2; §4.2; §4.3 Bayes判别; §4.3 Bayes判别; §4.4 Fisher判别; §4.4 Fisher判别; §4.4 Fisher判别; §4.4 Fisher判别; §4.4 Fisher判别; §4.5; §4.5; §4.5; §4.5; §4.6 判别分析应用的几个例子 判别分析的逻辑框图如下:; ; ? 下面用SPSS软件中的 Discriminant模块来实现判别分 析。; 定义新的变量y为被解释变量,用“1”代表Setosa鸢尾花,用 “2”代表Versicolor鸢尾花,用“3”代表Virginica鸢尾花,将萼片 长(sepal length)、萼片宽(sepal width)、花瓣长(petal length) 和花瓣宽(petal width)四个变量作为解释变量。 使用SPSS软件中的Analyze→Classify→Discriminant,就进入 了判别分析的对话框。分组变量(Grouping Variable)选择y,然后定 义其区域,最小值是1,最大值是3。解释变量(Independents)选择 sepal.length,sepal.width,petal.length和petal.width。; ? 保存(Save)选项中可以选择预测的分类、判别得分以及所 属类别的概率。如果采用逐步判别法,我们还可以选择判 别的方法(Method)。得到分析结果如下(见输出结果4—1) 。; ?; ? 输出结果4—2是对各组协方差矩阵是否相等的Box’s M检 验。第1张表反映协方差矩阵的秩和行列式的对数值。由 行列式值可以看出,协方差矩阵不是病态矩阵。第2张表是 对各总体协方差阵是否相等的统计检验。由F值及其显著 水平,我们在0.05的显著性水平下拒绝原假设(原假设假定 各总体协方差阵相等)。因此,在分类(Classify)选项中的协 方差矩阵选择可以考虑采用Separate-groups,以检验采用 Within-groups和Separate-groups两种协方差所得出的结 果是否存在显著差异。如果存在显著差异,就应该采用 Separate-groups协方差矩阵;反之,就用Within-groups协方 差矩阵。; * * *; ? 我们可以根据这个判别函数计算每个观测的判别Z得分。 第4张表??反映判别函数在各组的重心。根据结果,判别函 数在y=1这一组的重心为(-7.608,0.215),在y=2这一组的 重心为(1.825,-0.728),在y=3这一组的重心为 (5.783,0.513)。这样,我们就可以根据每个观测的判别Z 得分对观测进行分类。; ?; ? 我们可以计算出每个观测在各组的分类函数值,然后将观测分类到 较大的分类函数值中。第4张表是分类矩阵表。Predicted Group Membership表示预测的所属组关系,Original表示原始数据的所属组关 系,Cross-validated表示交叉验证的所属组关系,这里交叉验证是采用“ 留一个在外”的原则,即每个观测是通过除了这个观测以外的其他观测 推导出来的判别函数来分类的。由第4张表可以看出,通过判别函数预 测,有147个观测是分类正确的,其中,y=1组50个观测全部被判对,y=2组 50个观测中有48个观测被判对,y=3组50个观测中有49个观测被判对, 从而有147/150=98%的原始观测被判对。在交叉验证中,y=1组50个观 测全部被判对,y=2组50个观测中有48个观测被判对,y=3组50个观测中 有49个观测被判对,从而交叉验证有147/150=98%的原始观测被判对 。还可以通过分类结果分析判对和判错的百分比。最后为分类结果图, 从图中可以看到,Setosa鸢尾花与Versicolor鸢尾花和Virginica鸢尾花 可以很清晰地区分开,而Versicolor鸢尾花和Virginica鸢尾花这两种之 间存在重合区域,即存在误判。; ? 我们还可以通过保存(Save)选项选择预测的类别关系和判别得分等 ,对观测进行诊断。; 由输出结果4—6的表(1)可以看出,通过判别函数预测,有146个观测是 分类正确的,其中,y=1组50个观测全部被判对,y=2组5

文档评论(0)

ning2021 + 关注
实名认证
文档贡献者

中医资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年05月10日上传了中医资格证

1亿VIP精品文档

相关文档