非参数设检验.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
非参数设检验

§ 7.4 非参数假设检验 在§7.2中讨论了母体分布类型为已知时的参数假设检验问题.一般在进行参数假设检验之前,需要对母体的分布进行推断.本节将讨论母体分布的假设检验问题.因为所用的方法适用于任何分布或者仅有微弱假定分布,实质上是不依赖于分布的.在数理统计学中不依赖于分布的统计方法统称为非参数统计方法.这里所讨论的问题就是非参数假设检验问题.这里所研究的检验是如何用子样去似全母体分布,所以又称为分布拟合扰度检验,一般有两种:一是拟合母体的分布函数;另一是拟合母体分布的概率函数.这里我们只介绍三种检验方法:概率图纸法. -拟合优度检验和柯尔莫哥洛夫斯米尔诺夫检验. 一, 概率图纸法 这是一种比较直观和简便的检验方法.它适合于在现场使用.目前常见的概率图纸有正态,对数正态,二项分布,指数分布和威布尔分布概率图纸等.这里我们只介绍正态概率图纸,关于其它分布的概率图纸的构造原理和使用方法都是类似的 正态概率图纸的构造原理 设母体有分布函数F(x),{N(,)}表示正态分布族.需要检验假设 这里和均为未知常数.在原假设为真时,通过中心化变换 即服从正态N(0,1).函数u(x)是x的线性函数. (7.13) 在(x,u(x))直角坐标平面上是一条直线.这条直线过(,0),且斜率为. 检验步骤. 事实上,我们知道的不是母体取出的一组子样观察值由格里汶科定理知道子样的经验分布函数依概率收剑于母体分布函数F(x).所以在检验母分体布函数F(x)是否属于正态分布族时,我们以大子样的经验分布函数作为母体分布的近似.若:F(x) ∈{N(,)}为真,那末点在正态概率图纸上应该在一条直线上.所以根据上述经验分布函数是母体分布函数F(x)很好的近似,点在正态概率图纸上也应该近似地在一条直线附近.倘若点列不是近似地在一条直线附近,那末只能说明F(x)不属于正态分布族.根据上述想法,用正态概率图纸去检验假设的具体步骤如下. 整理数据 描点 目测这些点的位置, 未知参数与的估计. 若通过概率图纸检验已经知道母体服从正态分布,我们就凭目测在概率图纸上画出最靠近各点的一条直线l,因为服从正态N(0,1),所以当,即x=时对应的概率F=0.5.因此,只要在概率图纸上面一条F=0.5的水平直线.这条直线与直线l的交点的横坐标就可以作为参数为的估计.又由(x)=1时所对应的概率F=0.8413的水平直线,这条直线与直线l的交点的横坐标为.这个显然满足即因此可以用差估计. 例 7.8 (略)见P338 二, 的似体检验法 前面介绍了直观而简便的概率图纸法,它不需要很多计算就能对母体分布族作出一个统计推断,并且还能对分布所含的参数作出估计.但是这种方法因人而异,且精度不高,又不能控制犯错误的概率.这里介绍-拟合检验法,它能够像各种显著性检验一样控制犯第一类错误的概率. 设母体的分布函数为具有明确表达式的F(x),.我们把随机变量的值域R分成k个互不相容的区间这些区间不一定有相同的长度. 设是容量为n的子样的一组观测值.为子样观测值中落入的频数.在这n次事件出现的频率为. 我们现在检验原假设.设在原假设成立下,母体落入区间的概率为,即 (7.14) 此时n个观察值中,恰有个值落入内,的观察值落入内,个观察值落入内的概率为 这是一个多项分布. 按大数定理,在为真时,频率与概率的差异不应太大.根据这个思想构造一个统计量 = (7.15) 称做-统计量.往后可以看到,用表示这一统计量不是没有原因的.因为它的极限分布就是自由度为k-1的-分布. 为了能够把-统计量用来作检验的统计量,我们必须知道它的抽样分布.我们先k=2的简单情形.在成立下, 其中 这时,频数我们考察 (7.16) 令 (7.17) 显然 (7.18) 由此可见与不是线性独立,且.于是 (7.19) 根据德莫弗-拉普拉斯极限定理,当n充分大时,随机变量的分布是接近于正态的,从而推得k=2情形的分布,当n充分大时,是接近于自由度为1的-分布. 对于一般情形有如下的定理. 定理 7.1 当为真时,即为母体的真实概率时,由(7.15)式所定义的统计量的渐近分布是自由度为k-1的-分布,即密度函数为 (7.20) 证 因为在n个观测值中恰有个观测值落入内, 的观察值落入内,个观察值落入内的概率为 这里.其特征函数 (7.21) 令

文档评论(0)

75986597 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档