网站大量收购独家精品文档,联系QQ:2885784924

第4章判别分析2.pptVIP

  1. 1、本文档共101页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章判别分析2

典型相关系数(Canonical Correlation)的平方,说明了判别函数因变量的变动,可以在多少程度上由自变量的变化所解释; 也即,该平方项反映这个判别函数携带了多少原始数据的信息,该值反映了该判别函数的信息价值,当然越大越好。 7.有效性的验证 (四)训练样本的选取* 现在我们希望只选取前13个样本作为“训练样本”生成判别函数,而保留最后两个样本仅作为测试样本: (四)训练样本的选取* 输出结果: 输出结果: * 数据:4-7.sav 该表显示:训练样本全部分类正确(正确率100%);但是,2个检验样本都分错了(正确率0%),原本是第三类的,分到了第一类 * 可见,第1、2、6个指标在各总体间的差异并不大 说明,真实类别的样本,全部预测正确。当然,用训练样本本身来验证,得到这样的结论是很正常的,不能说明什么问题。使用检测样本进行验证才更有效力,见本章最后知识点“训练样本的选取”中的同类输出结果。 本页内容,来自中澳班《商务营销统计》英文教材 * 本页内容,来自中澳班《商务营销统计》英文教材 此页PPT是对“典型”进行解释:所谓“canonical”,即全部变量的量纲都是相同的,这样判别分析的系数,就没有收到不同量纲的影响 * 本页内容,来自中澳班《商务营销统计》英文教材 * 本页内容,来自中澳班《商务营销统计》英文教材 * * 此处,关于B、J、I等矩阵的理解,应回忆第二章第四节“多元正态分布的参数估 计 ”中,“用X表示Xbar和S”的部分(P56-59页) * SPSS上机作业 1、对例题4.5(鸢尾花)进行判别,写出贝叶斯判别函数和Fisher判别函数。(SPSS数据文件:4-5.sav) 2、美国某城市的居民家庭,按其有无割草机可分成两组:有割草机的家庭为第一组,记为G1;没有割草机的家庭为第二组G2。割草机工厂欲判断一些家庭是否将购买割草机。从G1和G2组中分别抽取了12个家庭,调查两项指标: X1 =家庭收入 ,X2 =房前屋后土地面积(数据见下页)。 (1)对上述情况进行判别,写出贝叶斯判别函数和Fisher判别函数。 (2)某个家庭X1 =37 ,X2 =9.9,请判断这个家庭是否会购买割草机? * * 3.某专家设计出一套评分体系来判别企业的经营状况。该体系对每个企业的如下八个指标进行评分:企业规模(is)、服务(se)、雇员工资比例(sa)、利润增长(prr)、市场份额(ms)、市场份额增长(msr)、流动资金比例(cp)、资金周转速度(cs)等。已经有90个企业被据此划分为“上升企业”、“稳定企业”和“下降企业”。(数据文件:4-7.sav) 请完成: (1)计算Fisher判别函数 (2)再使用逐步判别方法,重新计算Fisher判别函数,比较与(1)结果的区别。 (3)该套数据适合进行(使用线性判别函数的)贝叶斯判别吗? * 本章结束 * 图来自于:《张文彤,高级》P178 * 1、4.19式中的各Xi,都是纯量随机变量,都是P维随机向量X中的p个元素。 而U(X),自然是一个新的随机变量。 2、这个投影,有k个?p?k,降维。 * 4.19式中的各Xi,都是纯量随机变量,都是P维随机向量X中的p个元素。 而U(X),自然是一个新的随机变量。 * 随机变量U‘X,怎么会有两个均值和两个方差呢?原因是,此处的随机变量U’X,本身就是两个:当X属于总体G1时,是一个;当X属于总体G2时,又是一个。 * 注意,由E的定义,费希尔判别,并不要求各个总体的协方差矩阵相等!!! * * 1、本页内容,来自《王学民》P165 2、特征值极值的这个定理的证明,见《王学民》P21、《张尧庭选讲》P43、44。 3、E为何是正定矩阵?原因在于第二章讲过了,协差阵永远是半正定的,一般都是正定的,而k个协差阵之和,当然也满足正定矩阵的定义。 4、讲到此处,应该复习一下特征值、特征向量:设A是向量空间的一个线性变换,如果空间中某一非零向量通过A变换后所得到的向量和X 仅差一个常数因子,即AX=kX ,则称k为A的特征值,X称为A的属于特征值k的特征向量或特征矢量(eigenvector)。 * 本页内容,来自《王学民》P165 4.24式,可用p=2,k=2时的情况来直观理解 * 本页内容,来自《王学民》P165 * 本页内容,来自《王学民》P166 * 该方法来自《朱建平》P53 * 关于矩阵的微商,哪里有教材讲?《高惠璇》P396,我记得好像古扎拉蒂的《计量经济学》附录里也讲过。 * B尖与B比较,发现B尖的求和项中多了ni这个项。原因类似于方差分析,因为B尖是在样本范畴内计算组间离差,要考虑各个总体样本容量ni的影响; B是在总体范畴内计算组间离差,自然也就没有样本容量

文档评论(0)

sheppha + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5134022301000003

1亿VIP精品文档

相关文档