研九讲非参数假设检验1.ppt

下载文档

25
0
约6.83千字
约 45页
2017-06-03 发布于上海
举报
版权申诉
保障服务

研九讲非参数假设检验1.ppt

1、本文档共45页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

这类问题在应用上很常见,理论模型是:设随机向量（X,Y）,X的可能取值是1,2,...,r,Y的可能取值是1,2,...,s. 现在对(X,Y) 进行了n次独立观察,发现“X=i,Y=j”的次数为 ,要据此检验这个假设。若记F(x,y)为(X,Y)的联合分布函数, 为X的分布函数, 为Y的分布函数,则X与Y独立, 就是对任意实数(x,y)有在这种问题中,常把数据排列为如下表这种表称为列联表(Contingency Table).表中如果独立性成立,则对一切i和j,有因此检验问题变成如果已知,则我们可以按Pearson 统计量的建立方法,令则由Pearson的结论知以为极限分布。但这里并不知道,因此,我们可用它们的极大似然估计代替。注意到H。成立时, 因此,这等价于求的极大似然估计,类似例2.9,注意到关于的似然函数为作方程组。解得的极大似然估计为从而得到统计量在H。成立的条件下,当n→∞时, 的极限分布为因此,可取作为H。的拒绝域，当n很大时,这检验的真实水平接近对X、Y连续取值的情况,与（一）中的2类似,可以将其离散化：设为（X，Y）的样本。具体做法: (1)将X的观察值范围（一∞,∞）分成r个互不相交的区间,将Y的观察值范围（一∞,∞）分成s个互不相交的区间,这样就组成了rs个互不相交的小矩形; (2)求出样本落入各个小矩形的实测频数; (3)当H。成立时,建立统计量当n充分大时, 渐近于分布。在水平下,当时,拒绝 H。否则就接受H。特别,当r=s=2时,得到2×2列联表,也常称为四格表 (Fourfold Table)是应用最广的一种,这时极限分布为 [例3.2] 某研究所推出一种感冒特效新药,为证明其疗效,选择200名患者为志愿者,将他们均分为两组,分别不服药或服药,观察三日后痊愈的情况,得出下列数据痊愈者未痊愈者合计未服药者服药者合计 52 100 44 100 104 96 200 问新药是否确有明显疗效? [例3.17]〈见例3.2〉题中设 =0.25 解:每个对象考察两个指标:X一一是否痊愈,Y一一是否服药。X取两个值:痊愈,未痊愈。Y:未服药,服药。要研究这两指标是否独立,这是r=s=2的二元列联表。这里代入(3．25)式得对于水平＝0．25，查表得所以接受H。认为这种感冒新药并无明显疗效。 Pearson 检验法使用范围广，不管总体是一维的还是多维的，是离散型的还是连续型的；总体分布中的参数可以是已知的，也可以是未知的；甚至不仅可以用于全样本，也可以用于截尾样本；还可用于成群数据。但由于是分组处理样本的观察值，从图3—7中可以看到，有时虽然原假设不成立，但在某一种划分之下，可有此时虽然但在这种划分之下，并不影响统计量真的观察值。特别对于截尾样本，分布的后一段可以完全不一样。而的数值却可以一样，因而很容易犯第二类错误，把不真的假设H。也接受下来。下面的柯尔莫哥洛夫检验可以克服这一缺点。 3.5.2 非参数假设检验在实际问题中,有时会遇到不知道总体服从什么分布的情况。这时需要对总体分布进行假设检验。这种假设检验不是对参数的，称为非参数的假设检验。非参数的假设检验的方法很多，下面我们只介绍两种一、皮尔逊拟合优度检验二、柯尔莫哥洛夫检验法在前面的课程中，我们已经了解了假设检验的基本思想，并讨论了当总体分布为正态时，关于其中未知参数的假设检验问题 . 然而可能遇到这样的情形，总体服从何种理论分布并不知道，要求我们直接对总体分布提出一个假设 . 一