- 1、本文档共45页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
研九讲非参数假设检验
这类问题在应用上很常见,理论模型是:设随机向量 (X,Y),X的可能取值是1,2,...,r,Y的可能取值是1,2,...,s. 现在对(X,Y) 进行了n次独立观察,发现“X=i,Y=j”的次 数为 ,要据此检验 这个假设。若记F(x,y)为(X,Y)的联合分布函数, 为X的分布函数, 为Y的分布函数,则X与Y独立, 就是对任意实数(x,y)有 在这种问题中,常把数据排列为如下表 这种表称为列联表(Contingency Table).表中 如果独立性成立,则对一切i和j,有 因此检验问题变成 如果 已知,则我们可以按Pearson 统计量的建 立方法,令 则由Pearson的结论知 以 为极限分布。 但这里 并不知道,因此,我们可用它们的极大似然估 计 代替。注意到H。 成立时, 因此,这等价于求 的极大似然估计,类似例2.9,注 意到 关于 的似然函数为 作方程组。 解得 的极大似然估计为 从而得到统计量 在H。成立的条件下,当n→∞时, 的极限分布为 因此,可取 作为H。的拒绝域,当n很大时,这检验的真实水平接近 对X、Y连续取值的情况,与(一)中的2类似,可以将其 离散化:设 为(X,Y)的样本。具体做法: (1)将X的观察值范围(一∞,∞)分成r个互不相交的 区间,将Y的观察值范围(一∞,∞)分成s个互不相交 的区间,这样就组成了rs个互不相交的小矩形; (2)求出样本落入各个小矩形的实测频数; (3)当H。成立时,建立统计量 当n充分大时, 渐近于 分布。 在水平 下,当 时,拒绝 H。 否则就接受H。 特别,当r=s=2时,得到2×2列联表,也常称为四格表 (Fourfold Table)是应用最广的一种,这时 极限分布为 [例3.2] 某研究所推出一种感冒特效新药,为证明其疗效,选择200名患者为志愿者,将他们均分为两组,分别不服药或服药,观察三日后痊愈的情况,得出下列数据 痊愈者 未痊愈者 合 计 未服药者 服药者 合 计 52 100 44 100 104 96 200 问新药是否确有明显疗效? [例3.17]〈见例3.2〉题中设 =0.25 解:每个对象考察两个指标:X一一是否痊愈,Y一一是否 服药。X取两个值:痊愈,未痊愈。Y:未服药,服药。要 研究这两指标是否独立,这是r=s=2的二元列联表。这里 代入(3.25)式得 对于水平 =0.25,查表得 所以接受H。认为这种感冒新药并无明显疗效。 Pearson 检验法使用范围广,不管总体是一维的还 是多维的,是离散型的还是连续型的;总体分布中的 参数可以是已知的,也可以是未知的;甚至不仅可以 用于全样本,也可以用于截尾样本;还可用于成群数 据。但由于是分组处理样本的观察值,从图3—7中可 以看到,有时虽然原假设 不成立,但 在某一种划分之下,可有 此时虽然 但在这种划分之下,并不影响统计量 真 的观察值。特别对于截尾样本,分布的后一段 可以完全不一样。而 的数值却可以一样, 因而很容易犯第二类错误,把不真的假设H。 也接受下来。下面的柯尔莫哥洛夫检验可以克 服这一缺点。 3.5.2 非参数假设检验 在实际问题中,有时会遇到不知道总体服从什么分布的情况。这时需要对总体分布进行假设检验。 这种假设检验不是对参数的,称为非参数的假设检验。 非参数的假设检验的方法很多,下面我们只介绍两种 一、皮尔逊 拟合优度检验 二、柯尔莫哥洛夫检验法 在前面的课程中,我们已经了解了假设检验的基本思想,并讨论了当总体分布为正态时,关于其中未知参数的假设检验问题 . 然而可能遇到这样的情形,总体服从何种理论分布并不知道,要求我们直接对总体分布提出一个假设 . 一
文档评论(0)