第3章 多元正态分布均值向量和协差阵的检验2.pptVIP

第3章 多元正态分布均值向量和协差阵的检验2.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 多元正态分布均值向量和协差阵的检验2.ppt

为何服从F分布:解释* * 关于这项功能,《张文彤高级》P9有详细解释。《何晓群本科》P41解释了其中的Simple选项。 * 关于这项功能,《张文彤高级》P9有详细解释。《何晓群本科》P41解释了其中的Simple选项。 Deviaton:偏对照,将每个因素水平的均值与全部因素水平的均值进行比较。 Simple:简单对照,对因素每个水平的均值都与参考水平的均值进行比较。需要选择一个参考水平。此时下侧的Reference Category被激活,选项有“First”和“Last”。默认是“Last”,表明最后一个因素水平是参考水平,每个因素水平都与它进行比较。本例中,广州是最后一个因素水平,所以就是北京vs.广州、上海vs.广州。如果选择“First”,则参考水平是第一个因素水平“北京”,则进行比较的是北京vs.上海、北京vs.广州。 Difference:除第一个因素水平外,因素的每一个水平的均值都与该水平前各水平的总均值进行比较。 Helmert:与Difference刚好相反,除最后一个水平外,因素的每个水平的均值都与该水平后各水平的总均值进行比较。 Repeated:对邻近水平进行连续比较,除第一个水平外,因素各水平的均值都与该水平前一个水平的均值做比较。 Polynomial:进行多项式比较。如果该因素有n个水平,则比较时会输出从线性到n-1次方曲线的比较结果。在该种比较中因素各水平被假设等间距。 * 《郭志刚》P266讨论了四种检验统计量的优劣。《张文彤》P34。 一般认为Pillai统计量最好。 * 《张文彤高级》P34。 《郭志刚》P266讨论了四种检验统计量的优劣。《张文彤》P34。 * 参考《何晓群本科》P40 * SPSS数据文件:3-3.sav Excel文件:3-3.xls n 个独立的标准正态分布变量的平方和服从自由度为k 的卡方分布 * 结果分析4:总体两两比较的结果 * 结果分析4:总体两两比较的结果 北京与广州的比较显示, 两个城市的人均收入差距不明显,但是消费支出的差异明显,这暗示消费支出的差异,是造成京穗两地居民生活水平差异的主要原因。 上海与广州的比较显示, 两个城市的人均收入差距明显,而消费支出的差异不明显,这暗示人均收入的差异,是造成沪穗两地居民生活水平差异的主要原因。 * 本章结束 * 第三章课后作业 1992年美国总统选举的三位候选人为布什、佩罗特和克林顿。从支持三位候选人的选民中分别抽取了20人,登记他们的年龄(X1)和受教育程度(X2),数据如右表。假定三组都服从多元正态分布,请检验这三组的总体均值是否存在显著区别。(SPSS数据文件: 3-3.sav) * 课程进度:第二次课,从此处开始 * Rejection region does NOT include critical value. * 1、W是Wishart分布,第二章P22页讲的。样本离差阵S就服从W分布。W分布是卡方分布在多元情况下的推广。 2、注意T2是一个纯量,因为此处的X,指的是随机向量。 3、为何Hotelling统计量用T2来表示?直观非正式理解:如果考虑一元情况下的Hotelling统计量,按Hotelling分布的定义,它就是nXX/S=n(X/根号S)的平方,注意S在多元情况下服从Whishart分布,收敛到一元,就是卡方分布,因此,按照t分布统计量的定义(正态分布除以根号下的卡方分布),分子(X/根号S)就是服从t分布,因此nXX/S实际就是t分布统计量的平方! * 1、一元情况下,为何服从t分布统计量的 平方服从F分布?这从t分布和F分布的定义看就容易理解了。《盛骤》P148页:t分布统计量=X除以根号下Y除以n,(其中X为标准正态分布,Y为自由度为n的卡方分布)那么t分布统计量的平方,就是nX平方除以Y。注意“X平方”就是自由度为1的卡方分布,因此,t分布统计量的平方,其实就是两个服从卡方分布的统计量的比值。而F分布的定义,恰好就是如此(两个自由度分别为n1和n2的卡方分布的统计量,其比值,服从F分布(n1,n2))。 2、实际上,更多的教材是用“似然比检验”来推出Hotelling统计量的。见《陆璇》P176、《王学民》第四章附录P130,《高惠璇》P70。难度大,超出本科教学范围。多元统计中,几乎所有重要的检验,都是利用似然比! 3、我总觉得《朱建平》第三章关于均值向量检验适用分布(总体协差阵已知时用卡方分布、未知时用F分布)的讲解,有点问题。 * 该检验的合理性可以从马氏距离(第四章第二节讲)的概念直观看出: 仔细分析T方统计量,其中间的部分实际是样本均值向量到总体均值的平方马氏距离!这个距离越小,说明反映总体真值取值的“样本均值向量

文档评论(0)

lnainai_sj + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档