- 1、本文档共51页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十二章 判别分析 五、逐步判别法(变量筛选) 为了得到对判别最合适的变量,可以使用逐步判别。也就是,先用少数变量进行判别;然后一边判别,一边引进判别能力最强的变量。这个过程可以有进有出。 评价一个变量的判别能力的方法是利用统计检验,例如Wilks’ Lambda Wilks’ Lambda 检验 如果利用 q 个变量,对 k 个总体进行判别分析。 若记:总离差矩阵为T;样本点的组内离差和的矩阵为W 令: 设: 判别函数中已经有q个变量,记为X*。这时考虑是否增加新变量 。可以计算偏?统计量: 定义: 偏F检验 对于判别函数中已经有的 q 个变量 X* 中,如果有对判别能力贡献不显著的变量存在,则应该将其从判别函数中删除。 例如:考虑 xk 是否可以从判别函数中删除,记删除掉 xk 后的变量组为X*(k),则有 如果有 例12.1.(数据在disc.sav)某刊物对企业经营状况进行分类 指标包括(8个):企业规模(is)、服务(se)、雇员工资比例(sa)、利润增长(prr)、市场份额(ms)、市场份额增长(msr)、流动资金比例(cp)、资金周转速度(cs)。 企业被划分为:上升企业(group-1) 、稳定企业(group-2)和下降企业(group-3) 训练样本:有90个企业,其中30个属于上升型,30个属于稳定型,30个属于下降型。 问题:希望找出一个分类标准,以便对企业进行分类。 使用SPSS软件 Analyze-Classify-Discriminant。 Grouping Variable : 输入分类变量——因变量(group) 在Define Range: 输入分类范围(在本例题中为:1-3) 在Independents: 输入所有自变量 用逐步判别,选择Use stepwise method,再在方法(Method)中选挑选变量的准则(检验方法:默认值为Wilks’ Lambda) 在Statistics中的Function Coefficient选 Fisher和Unstandardized: 可以输出Fisher分类函数的结果 在Classify中的Display选summary table, Leave-one-out classification:分别输出原始数据和交叉验证的正确判别率 在Plots可选 Combined-groups 利用SPSS软件的逐步判别法,淘汰了不显著的“流动资金比例(cp)”,还剩下七个变量。 用x1,x2, x3, x4,x5, x6, x7分别表示变量is,se,sa,prr,ms,msr,cs,得到两个典则判别函数. SPSS给出这些判别函数的重要程度 投影的重要性是和特征值的贡献率有关。该表说明第一个函数的贡献率已经是99%了,而第二个只有1%。 三个线性分类函数的系数 训练样本的分类结果——分类函数正确分类的比例 如果只用3个变量进行判别:企业规模(is)、服务(se)、雇员工资比例(sa)计算结果中图形的分辨能力下降,判别的正确率低于前面分析 代谢组学研究及其数据分析 咨询建议 1、你对这个计算结果有什么印象? 2、你对下一步工作有什么建议? 对数据disc.sav,只选取少数两三个变量进行计算。看结果有什么不同。试着在SPSS上利用各种不同的选项。 3. 讨论判别分析和聚类分析有什么不同? Grouping Variable : 输入分类变量——因变量(group) 在Define Range: 输入分类范围(在本例题中为:1-3) 在Independents: 输入所有自变量 用逐步判别,选择Use stepwise method,再在方法(Method)中选挑选变量的准则(检验方法:默认值为Wilks’ Lambda) 在Statistics中的Function Coefficient选 Fisher和Unstandardized: 可以输出Fisher分类函数的结果 在Classify中的Display选summary table, Leave-one-out classification:分别输出原始数据和交叉验证的正确判别率 在Plots可选 Combined-groups 两个典则判别函数导出的150个企业的二维点图 把每个观测点带入三个函数,就可以得到分别代表三类的三个值。哪个值最大,该点就属于相应的那一类。 基于3个变量时分类结果表 3 23 4 92.2% 北
您可能关注的文档
最近下载
- 北师大版数学六年级上册1.2 圆的认识(二)课件(共21张PPT).pptx VIP
- 爆破工程技术人员取证培训初级D设计题真题参考答案.pdf VIP
- 征信报告模板-带水印-通用.docx VIP
- 女儿墙维修工程施工方案(3篇).docx VIP
- 找准下一个买卖点.docx VIP
- 2026届高一物理必修一同步1.4 速度变化快慢的描述——加速度(解析版).docx VIP
- UniStrong合众思壮eSurvey2.0软件使用说明书.pdf VIP
- 中国宏桥首次覆盖报告:高景气与一体化与高分红,电解铝龙头静待价值重估.docx VIP
- 中国宏桥-市场前景及投资研究报告:高景气+一体化+高分红,电解铝龙头,价值重估.pdf VIP
- 少女漫画·女作家·日本人-中外文学作品丛书.docx VIP
文档评论(0)