统计学第13讲 第13章 非参数检验.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学第13讲 第13章 非参数检验

* * 第13章 非参数检验 13.1 导言 科研中不是所有的变量都可以采用参数检验,如果变量严重偏离已知分布,可考虑采用非参数检验。即便在小样本情况下,非参数检验仍然和参数检验一样有效。 在选择检验方法时要小心,如果是试探性的,可选择一些样本,使用多种检验方法进行统计分析,借以了解不同检验方法的差异。 但是要避免下列错误做法:先搜集数据,在“货比三家”后选择一个有利于自己科研结果的,并且能带来统计显著性的统计方法 科研中。虚无假设、备择假设、统计检验、抽样分布以及显著性水平都必须在数据搜集之前就要确定下来。如果先搜集数据,再“货比三家”地考虑统计分析方法,我们会为了“差异显著”而夸大偶然造成的差异效应,会增大犯Ⅰ类错误的概率。 13.2 类别变量 分类变量的数据就是计数数据,非参数检验适合小样本的计数数据。但是当大样本时,计数数据也可考虑使用参数检验。 测量、等距、比率量表,当样本小并且分布不明朗,不服从正态分布,可考虑非参数检验。 13.2.1 二项检验 称名量表的测量水平最低,常用二分类,(two-category)或二分总体(dichotomous population) 请同学举例说明有那些二分总体? 男女,对错,正反,阴阳,有无文化…………. 定义:二分总体中, p 为一类所占的比例,q=1-p为另一类所占比例。 例题:某大学教导主任说,自从学校禁售香烟以来,吸烟学生比例下降到70%以下。但是对其他学校观察发现,禁售对吸烟影响不大,仍然有70%的人在吸烟。请检验教导主任的说法是否正确。 随机抽取40名同学,询问发现其中有12名吸烟。则不吸烟的同学数量为: X=28 用 P0 表示总体吸烟比例 1. 虚无假设:吸烟学生总体比例P0≥0.7 2. 备择假设:样本所在总体比例P0<0.7 4. 统计检验: 二分总体 , 采用二项式检验 5. 抽样分布: 统计量为 X , 在附表N中列出N≤50时,不同p,q的单侧临界值。 3. 显著水平:α=0.05,单尾检验 6. 临界区间:参照表N,N=40,p=0.30,q=0.70,发现0.05的临界值为18,单尾检验。 7. 因为X=28>18,拒绝H0,认为教导主任是对的 31 34 31 33 … … 21 23 ……. 4 5 3 4 0.01 0.05 49 … … … … … … … … … 26 28 26 28 … … 20 18 …. ….. 3 4 3 3 0.01 0.05 40 …. … …. … …. …. ….. … …. - - - - …… — — …. …. 2 2 1 2 0.01 0.05 3 - - - - …… — — …. … 1 2 1 1 0.01 0.05 2 0.50 0.50 0.49 0.51 … … 0.30 0.70 … … 0.02 0.98 0.01 0.99 p q N 表N 当N=2~49时, α=0.01和0.05时,p和q各种取值下的临界值 N=40,α=0.05,因为X=28>18,拒绝H0,认为教导主任是对的 13.2.2 当N比较大时,二项分布近似正态曲线 当p=q=0.5,或p、q接近0.5时,二项分布接近正态分布 简便法则:当pq接近0或1时,Npq至少等于9,当p=q=0.5时,N≥25。 此时,二项变量X~N(Np, ) 的正态分布 13-1 z ~N(0, 1 ) ,X的概率= z 对应的概率 例题 已知 X=5,N=20,p=q=0.5,α=0.05,双尾检验。计算P(X≤5) 或P(X≥15) 当α=0.05,双尾检验时,| z |1.96,所以拒绝H0 如果我们从附表M中查找, X=5,N=20,双尾检验,发现:拒绝H0需要N-X≥15,本题N-X=15,所以拒绝H0。这和利用正态分布计算是一致的。表M只列出了N=50的临界值,建议N50时才使用正态分布。 13.3 单变量的χ2 检验 肥胖与健康问题有关,亚特兰大疾控中心定期进行全国青少年危机监督调查,对11631名男女青年(9到12年级)自身体重观的部分调查结果。 5816 1995 3402 419 合计 过胖 正常 偏瘦 这个问题可以使用单变量χ2 检验或拟合优度检验(goodness-of-fit test) 观测值与虚无假设下的期望值之间是否存在差异? 观测值分布是否与理论分布相吻合? 表13-1 女生的自身体重观 5816 f3 f2 f1 合计 过胖 正常 偏瘦 H0: f1=f2=f3 如果观察值与期望值比较接近,则χ2 很小,不拒绝H0 , 否者χ2 会增大, χ2 越大,则越有可能拒绝H0. 在

文档评论(0)

gooddoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档