第九章判别分析.pptVIP

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十二章 判别分析 五、逐步判别法(变量筛选) 为了得到对判别最合适的变量,可以使用逐步判别。也就是,先用少数变量进行判别;然后一边判别,一边引进判别能力最强的变量。这个过程可以有进有出。 评价一个变量的判别能力的方法是利用统计检验,例如Wilks’ Lambda Wilks’ Lambda 检验 如果利用 q 个变量,对 k 个总体进行判别分析。 若记:总离差矩阵为T;样本点的组内离差和的矩阵为W 令: 设: 判别函数中已经有q个变量,记为X*。这时考虑是否增加新变量 。可以计算偏?统计量: 定义: 偏F检验 对于判别函数中已经有的 q 个变量 X* 中,如果有对判别能力贡献不显著的变量存在,则应该将其从判别函数中删除。 例如:考虑 xk 是否可以从判别函数中删除,记删除掉 xk 后的变量组为X*(k),则有 如果有 例12.1.(数据在disc.sav)某刊物对企业经营状况进行分类 指标包括(8个):企业规模(is)、服务(se)、雇员工资比例(sa)、利润增长(prr)、市场份额(ms)、市场份额增长(msr)、流动资金比例(cp)、资金周转速度(cs)。 企业被划分为:上升企业(group-1) 、稳定企业(group-2)和下降企业(group-3) 训练样本:有90个企业,其中30个属于上升型,30个属于稳定型,30个属于下降型。 问题:希望找出一个分类标准,以便对企业进行分类。 使用SPSS软件 Analyze-Classify-Discriminant。 Grouping Variable : 输入分类变量——因变量(group) 在Define Range: 输入分类范围(在本例题中为:1-3) 在Independents: 输入所有自变量 用逐步判别,选择Use stepwise method,再在方法(Method)中选挑选变量的准则(检验方法:默认值为Wilks’ Lambda) 在Statistics中的Function Coefficient选 Fisher和Unstandardized: 可以输出Fisher分类函数的结果 在Classify中的Display选summary table, Leave-one-out classification:分别输出原始数据和交叉验证的正确判别率 在Plots可选 Combined-groups 利用SPSS软件的逐步判别法,淘汰了不显著的“流动资金比例(cp)”,还剩下七个变量。 用x1,x2, x3, x4,x5, x6, x7分别表示变量is,se,sa,prr,ms,msr,cs,得到两个典则判别函数. SPSS给出这些判别函数的重要程度 投影的重要性是和特征值的贡献率有关。该表说明第一个函数的贡献率已经是99%了,而第二个只有1%。 三个线性分类函数的系数 训练样本的分类结果——分类函数正确分类的比例 如果只用3个变量进行判别: 企业规模(is)、服务(se)、雇员工资比例(sa) 计算结果中图形的分辨能力下降,判别的正确率低于前面分析 代谢组学研究及其数据分析 咨询建议 1、你对这个计算结果有什么印象? 2、你对下一步工作有什么建议? 对数据disc.sav,只选取少数两三个变量进行计算。看结果有什么不同。试着在SPSS上利用各种不同的选项。 3. 讨论判别分析和聚类分析有什么不同? Grouping Variable : 输入分类变量——因变量(group) 在Define Range: 输入分类范围(在本例题中为:1-3) 在Independents: 输入所有自变量 用逐步判别,选择Use stepwise method,再在方法(Method)中选挑选变量的准则(检验方法:默认值为Wilks’ Lambda) 在Statistics中的Function Coefficient选 Fisher和Unstandardized: 可以输出Fisher分类函数的结果 在Classify中的Display选summary table, Leave-one-out classification:分别输出原始数据和交叉验证的正确判别率 在Plots可选 Combined-groups 两个典则判别函数导出的150个企业的二维点图 把每个观测点带入三个函数,就可以得到分别代表三类的三个值。哪个值最大,该点就属于相应的那一类。 基于3个变量时分类结果表 3 23 4 92.2% 北

文档评论(0)

天马行空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档