- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6章非参数检验汇
第6章 非参数检验 6.1 符号检验 6.2 Wilcoxon符号秩检验 6.3 WMW秩和检验 6.4 Kruskal-Wallis检验 非参数检验的应用场合 如果需要对定性数据做假设检验,则需要使用非参数方法 如果需要对中位数做检验,则需要使用非参数的方法。 如果需要对统计分布做检验,例如检验数据是否来自正态总体,检验两个总体的统计分布是否相同等,则需要用非参数方法。 当参数检验需要的假设不成立时, 需要采用非参数检验方法。特别的,非正态总体、小样本的情况下,传统的t检验是不能使用的。 6.1 符号检验 符号检验(Sign Test):是最简单的非参数检验方法之一,通过符号+和-的个数来做统计推断,所以称为符号检验。 一个例子:联合国人员在世界上66个大城市的生活花费指数(以纽约市1996年12月为100)按由小至大的次序排列如下。 对均值的t检验 问题:假定这是从世界许多大城市中随机抽样而得到的样本。 北京的指数为99,能否认为北京市在总体平均水平之上? 分析:由于是大样本,所以不论总体是否正态,都可以根据单个样本的t检验进行分析,检验总体的均值是否小于99。如果能够认为总体的均值小于99,则可以知道北京市在总体水平之上。 SPSS对均值的t检验结果 左侧检验时p值等于0.257/2=0.1285,因此在5%的显著性水平下不能拒绝总体均值大于等于99的原假设。从而,没有证据表明北京市在总体平均水平之上。 然而…… 此组数据的直方图如下,可以判断总体数据很可能为右偏分布。 这时中位数比均值更有代表性。 下面我们来检验能否认为总体的中位数小于99。 符号检验的基本原理(左侧检验) 用M表示总体中位数。 表示大于中位数的数据个数。在这个例子中,需要检验M是否小于99。 在样本的数据中,如果原假设成立,则大于99的数据个数 应该比较大。 因此,如果从总体中得到 的样本的概率非常小,则可以拒绝原假设。 检验统计量 如果M的确是总体的中位数,则每个样本点都以0.5的概率小于(或大于)M。这显然是一系列Bernoulli试验。大于M的样本点的个数 与小于M的个数 都服从二项分布 B(n,0.5),二者都可用作检验统计量。 因此,假设x服从二项分布 B(66,0.5)在这个例子中只需要计算 如果p值小于a,则拒绝原假设。 根据二项分布的计算结果 在这个例子中大于99的数据个数为23。 在Excel单元格中输入“=BINOMDIST(23,66,0.5,1)”,可知这一概率(p值)为0由于p值小于a,则拒绝原假设。 结论:总体的中位数要小于99。 在这种情况下,可以认为北京的生活指数(99)高于世界大城市的中位数 根据正态分布的计算结果 当样本量比较大(n20)时,可以使用正态分布近似计算p值。 二项分布 B(n,0.5)的期望为0.5n,方差为npq=0.25n。 在这里z=-2.4618, P(z≤-2.4618)=0.0069因此在左侧检验中拒绝原假设。 由于二项分布为离散的,正态分布是连续的,因此二者计算结果有差异。软件中通过使用“连续性修正”的方法可以缩小这种差异,得到更接近的结果。 双侧检验时的p值 当零假设为真时, 不应该太大或太小。如果 太大或太小,则可以拒绝原假设。 p值等于 根据给定的显著性水平得出检验结论。 右侧检验时的p值 当零假设为真时, 不应该太大。如果 太大,则可以拒绝原假设。 假设x服从二项分布 B(n,0.5),则p值等于 根据给定的显著性水平得出检验结论。 符号检验在SPSS中的实现 以例6.1为例,检验世界花费指数的中位数是否小于99,因此提出假设如下: 在SPSS17.0中,使用选项Analyze-Nonparametric Tests- Binomial,再把变量“生活花费指数”选入Test Variable List。然后在下面Define Dichotomy的Cut Point输入“99”,在下面Test Proportion输入“0.50”,得到如下对话框。 例6.1的SPSS结果含义 在二项检验的结果中,小于等于99的观测值个数有43个,大于99的有23个,共66个;所观察的比例分别是0.65和0.35,检验的比例为0.5。 双侧检验的p值为0.019。 对于这里的左侧检验,检验的p值为0.019 /2=0.0095,小于显著性水平0.05,因此,拒绝零假设。 成对数据比较的符号检验 成对数据可以采用t检验的方法,但需要有正态性的或者大样本的假设条件。 如
文档评论(0)