非参数统计学讲义(第2章)讲稿.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
非参数统计学讲义(第2章)讲稿

PAGE 0 PAGE 21 第 页 第二章 单样本模型 §1 符号检验和有关的置信区间 在有了一个样本之后,很自然地想要知道它所代表的总体的“中心”在哪里.例如,在对人们的收入进行了抽样之后,就自然要涉及“人均收入”和“中间收入”等概念.这就与统计中的对总体的均值(mean),中位数(median)和众数(mode)等位置参数的推断有关。例如,在知道总体是正态分布时,要检验其均值是否为;一个传统的基于正态理论的典型方法是t检验.它的检验统计量定义为 这里为样本均值,而为样本标准差。t—检验的统计量在零假设下有n—1个自由度的t—分布。检验统计量是用样本标准差s代替了有标准正态分布的检验统计量的总体标准差后而产生的在大样本时,二者几乎相等。t—检验也许是世界上用得最广泛的检验之一。但是,t—检验并不稳健,在不知总体分布时,特别是小样本时,应用t—检验就可能有风险。这时就要考虑使用非参数方法。对于本章所要介绍的数据趋势或随机性检验,就不存在简单的参数方法.非参数方法总是简单实用的。 本章所介绍的一些检验有代表性,因此这里的讨论将比其它章节更为仔细.一旦熟悉了非参数方法的一些基本思路,后面的内容就很容易理解了. 问题的提出 【例2-1】联合国人员在世界上66个大城市生活花费指数(以纽约市1962年12为100)按自小至大的次序排列如下(这里北京的指数为99): 表2-1 生活花费指数数据 66757880818182838383838485858686868687878888888888898989899090919191919293939696969799100101102103103104104104105106109109110110110111113115116117118155192在例子中,人们可能会问:①总体的平均(或者中间)水平 刻划位置参数的量有:①平均值:;②中位数:;③修整均值:,;④众数;⑤中列数:。 是多少?②北京是在该水平之上还是之下? 可以假定这个样本是从世界许多大城市中随机抽样而得的所有大城市的指数组成总体.可能出现的问题是:这个总体的平均(或者中间)水平是多少?北京是在该水平之上还是之下?这里的平均(或中间)水平是一个位置参数。一般的统计书中的均值就是一个位置参数.中位数是另一个位置参数.它们都是数据总体中心位置的度量和位置参数相对的一个参数为尺度参数;比如在标准统计课本中的描述数据集中和分散程度的方差或标准差. 这个例子经过简单计算,得到样本均值为96.45,而样本中位数为91;它们都可作为总体的中心的估计,除此之外,众数(频率最大的点,本例是88)可作为中间位置. 通常在正态总体分布的假设下,关于总体均值的假设检验和区间估计是用与t检验有关的方法进行的。然而,在本例中,总体分布是未知的为此首先看该数据的直方图从图中很难说这是什么分布。在右边的两个点分别是东京和香港。 由于此时我们不知道总体是否为正态分布(或者数据表明它就不是一个正态分布),所以有关参数统计中的t-统计量就不能用,势必要选择非参数的统计量来解决这样的问题。 符号检验(Sign Test)是利用正、负号的数目对某种假设作出判定的非参数统计方法。 普通的符号检验 1.基本方法 如果所研究的问题,可以看作是只有两种可能:“成功”或“失败”,并且成功或失败的出现被假定遵从二项式分布,以“+”表示成功,以“-”表示失败,那么随机抽取的样本就有两个参数:成功的概率P+和失败的概率P—。这样就可以构造一个假设: 这是双侧检验,对备择假设H1来说,不要求P+是否大于P—。如果所研究的问题,要求考虑是P+比较大还是P—比较大,则需用单侧备择假设,即 这里表示P+是比较大的,被用来说明P—是比较大的。 为了检验上面的假设,普通的符号检验所定义的检验统计量为和。表示为正符号的数目,表示为负符号的数目,是符号的总数目。 要对假设作出判定,需要找到一个P值。因为对于和来说,抽样分布是一个带有(表示成功的概率)的二项式分布,所以如果H0为真,从二项分布表中能够根据n、和查到P值。若P值很小,表明H0为真的可能性很小,数据不支持H0,而支持H1。 注:①双边假设检验中的尾概率P-值应是单边假设检验中的P-值的2倍;②在n()较小时,可以利用二项分布表查表,计算出精确的P-值;在n(n>20)较大时,则要用正态分布来近似,因为,所以,并且要作连续性修正。 

文档评论(0)

ktj823 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档