《应用统计学》第10章:卡方检验和非参数检验.ppt

《应用统计学》第10章:卡方检验和非参数检验.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
应用统计第1章 第10章 卡方检验和非参数检验 本章教学内容: 总体分布的卡方检验; 两个比例差异的卡方检验(独立样本); 两个以上比例差异的卡方检验(独立样本); 独立性的卡方检验; 两个比例差异的McNEMAR检验(相关样本); 两个独立总体的非参数检验(Wilcoxon秩和检验); 单因素方差分析的非参数检验(Kruskal-Wallis秩检验) 非参数检验概述 在总体分布形式已知条件下未知参数检验问题。但实际问题中总体的分布形式往往是未知的,虽然根据中心极限定理可以有相当的把握认为大多数经济变量服从或近似服从正态分布,但有时为了使所做的统计推断更具说服力,就需要对总体的分布形式进行检验。 §10.1 总体分布的 检验 检验的基本原理: (1) 设x1, x2, … , xn为总体X的一组样本观察值,F(x)为某一已知分布的分布函数,?1, ?2, … , ?r是F(x)的r个待定参数,分别是r个参数的点估计,以分别代替?1, ?2, … ,?r ,作原假设 H0:总体X的分布函数为F(x) (2) 将F(x)的定义域划分为k个互不相交的区间 (ai , ai+1?,i =1,2,…, k;记fi为样本观察值x1, x2, … , xn落在第个区间(ai ,ai+1? 内的频数,并记 Pi=P{ai X≤ ai+1}= F(ai+1)-F(ai ) 为以F(x)为分布函数的随机变量在区间 (ai, ai+1? 上取值的概率,i =1,2,…, k。则当H0为真时,由贝努里定理,当n充分大时,n次独立重复试验结果的实际频率 与其概率Pi之间的差异并不显著,于是显然可以用统计量来刻画它们间总的差异的大小。其中nPi为理论频数。其中nPi为理论频数。当H0为真时,下式的值就应当较小 (3) 可以证明,当n充分大时(n≥50),若H0为真,则统计量 近似服从(k -r -1)分布。其中r为分布F(x)中待定参数的个数。于是在给定显著性水平?下,若 就拒绝H0,说明总体X的真实分布函数与F(x)间存在显著差异;否则接受H0,即可以认为两者在水平?下并无显著差异。 某厂有一台经常需要维修的设备,该设备中有一个易损坏的重负荷轴承,设备故障的主要原因是轴承损坏。为了制定该设备的维修计划和维修预算,需要了解该轴承的寿命分布。下表给出了100个轴承寿命的观察数据,问:该轴承寿命是否服从正态分布? 解:由表中数据,用Excel可求得 =120.95, S2=40.582 ,故可作原假设 H0:X~ N (120,402) 将实轴划分为如下7个互不相交的区间。用Excel的FREQUENCY函数计算数据落在各区间内的频数,用NORMDIST函数求出各理论频数nPi ,统计量的计算如表所示。 取显著性水平? = 0.25 (由于原假设H0是我们希望得到的结果,为使检验结论更具说服力,控制的重点应是与原假设H0不真而接受H0的概率,故? 应取的稍大些)。本例中k = 7,r = 2,k –r -1 = 4。 故在水平? = 0.25下接受原假设H0,即可认为该轴承的使用寿命服从N (120,402)分布。 §10.2 比例差异的 检验(独立样本) 1. 两个比例差异的检验 前面,我们研究了两个比例的Z检验。这部分从不同角度检验数据。假设检验过程使用近似卡方( )分布的检验数据。 如果想要比较两个独立样本组的分类变量,可以做两维的列联表,显示每组的第1类(正向类,如“成功”,“是”等)和第2类(反向类,如“失败”,“否”等)出现的频数,如表所示 为了检验组一样本有关类1的比例是否等于第二组样本有关类1的比例,即假设检验为: 原假设为两比例之间无显著差异: 备择假设为两比例之间有差异: 使用卡方( )检验的基本思路为: (1) 确定统计量为 其中 为列联表中特定单元的观测频数, 为列联表中特定单元的期望频数,因此这里的统计量 是观测频数和期望频数差的平方除以每单元的期望频数,并对表中的所有单元格取和求得; (2) 可以证明上述统计量 近似服从自由度为1的 分布,因此在显著性水平下,决策规则为: 如果 ,拒绝 否则,接受

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档