第3章多元正态分布均值向量和协差阵的检验2.pptVIP

下载本文档

318
0
约1.09万字
约 99页
2017-05-15 发布于北京
举报
版权申诉

第3章多元正态分布均值向量和协差阵的检验2.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第3章多元正态分布均值向量和协差阵的检验2.ppt

为何服从F分布：解释* * 关于这项功能，《张文彤高级》P9有详细解释。《何晓群本科》P41解释了其中的Simple选项。 * 关于这项功能，《张文彤高级》P9有详细解释。《何晓群本科》P41解释了其中的Simple选项。 Deviaton：偏对照，将每个因素水平的均值与全部因素水平的均值进行比较。 Simple：简单对照，对因素每个水平的均值都与参考水平的均值进行比较。需要选择一个参考水平。此时下侧的Reference Category被激活，选项有“First”和“Last”。默认是“Last”，表明最后一个因素水平是参考水平，每个因素水平都与它进行比较。本例中，广州是最后一个因素水平，所以就是北京vs.广州、上海vs.广州。如果选择“First”，则参考水平是第一个因素水平“北京”，则进行比较的是北京vs.上海、北京vs.广州。 Difference：除第一个因素水平外，因素的每一个水平的均值都与该水平前各水平的总均值进行比较。 Helmert：与Difference刚好相反，除最后一个水平外，因素的每个水平的均值都与该水平后各水平的总均值进行比较。 Repeated：对邻近水平进行连续比较，除第一个水平外，因素各水平的均值都与该水平前一个水平的均值做比较。 Polynomial：进行多项式比较。如果该因素有n个水平，则比较时会输出从线性到n-1次方曲线的比较结果。在该种比较中因素各水平被假设等间距。 * 《郭志刚》P266讨论了四种检验统计量的优劣。《张文彤》P34。一般认为Pillai统计量最好。 * 《张文彤高级》P34。《郭志刚》P266讨论了四种检验统计量的优劣。《张文彤》P34。 * 参考《何晓群本科》P40 * SPSS数据文件：3-3.sav Excel文件：3-3.xls n 个独立的标准正态分布变量的平方和服从自由度为k 的卡方分布 * 结果分析4：总体两两比较的结果 * 结果分析4：总体两两比较的结果北京与广州的比较显示，两个城市的人均收入差距不明显，但是消费支出的差异明显，这暗示消费支出的差异，是造成京穗两地居民生活水平差异的主要原因。上海与广州的比较显示，两个城市的人均收入差距明显，而消费支出的差异不明显，这暗示人均收入的差异，是造成沪穗两地居民生活水平差异的主要原因。 * 本章结束 * 第三章课后作业 1992年美国总统选举的三位候选人为布什、佩罗特和克林顿。从支持三位候选人的选民中分别抽取了20人，登记他们的年龄（X1）和受教育程度（X2），数据如右表。假定三组都服从多元正态分布，请检验这三组的总体均值是否存在显著区别。（SPSS数据文件： 3-3.sav） * 课程进度：第二次课，从此处开始 * Rejection region does NOT include critical value. * 1、W是Wishart分布，第二章P22页讲的。样本离差阵S就服从W分布。W分布是卡方分布在多元情况下的推广。 2、注意T2是一个纯量，因为此处的X，指的是随机向量。 3、为何Hotelling统计量用T2来表示？直观非正式理解：如果考虑一元情况下的Hotelling统计量，按Hotelling分布的定义，它就是nXX/S＝n（X/根号S）的平方，注意S在多元情况下服从Whishart分布，收敛到一元，就是卡方分布，因此，按照t分布统计量的定义（正态分布除以根号下的卡方分布），分子（X/根号S）就是服从t分布，因此nXX/S实际就是t分布统计量的平方！ * 1、一元情况下，为何服从t分布统计量的平方服从F分布？这从t分布和F分布的定义看就容易理解了。《盛骤》P148页：t分布统计量＝X除以根号下Y除以n，（其中X为标准正态分布，Y为自由度为n的卡方分布）那么t分布统计量的平方，就是nX平方除以Y。注意“X平方”就是自由度为1的卡方分布，因此，t分布统计量的平方，其实就是两个服从卡方分布的统计量的比值。而F分布的定义，恰好就是如此（两个自由度分别为n1和n2的卡方分布的统计量，其比值，服从F分布（n1,n2））。 2、实际上，更多的教材是用“似然比检验”来推出Hotelling统计量的。见《陆璇》P176、《王学民》第四章附录P130，《高惠璇》P70。难度大，超出本科教学范围。多元统计中，几乎所有重要的检验，都是利用似然比！ 3、我总觉得《朱建平》第三章关于均值向量检验适用分布（总体协差阵已知时用卡方分布、未知时用F分布）的讲解，有点问题。 * 该检验的合理性可以从马氏距离（第四章第二节讲）的概念直观看出：仔细分析T方统计量，其中间的部分实际是样本均值向量到总体均值的平方马氏距离！这个距离越小，说明反映总体真值取值的“样本均值向量

您可能关注的文档

文档评论（0）

lnainai_sj + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第3章多元正态分布均值向量和协差阵的检验2.pptVIP