多元统计分析讲座-非参数检验.pptx

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《SPSS多元统计分析方法及应用》系列讲座;《SPSS多元统计分析方法及应用》系列讲座;非参数检验;非参数检验基本原理 单样本非参数检验 两独立样本非参数检验 多独立样本非参数检验 两相关样本非参数检验 多相关样本非参数检验 非参数检验SPSS实例;非参数检验是相对于参数检验而言的,是指在总体分布未知或知之甚少时,利用已知样本数据对总体分布形态做出推断的方法。 非参数检验主要是利用样本数据之间的大小比较及大小顺序,对两个或多个样本所属总体的分布是否相同进行检验,而不对总体分布的参数如平均数、标准差等进行统计推断。 ;相对于参数检验,非参数检验的优点包括: 对总体的假定相对较少,效率高,结果一般有较好的稳定性; 不仅适用于定比数据和定距数据的检验,还适用于定类数据和定序数据的检验,可以解决参数假设检验无法解决的定性资料的检验问题; 思想容易理解,计算简单,尤其适用于小样本。 ;非参数检验的缺点包括: 最大的不足是没能充分利用数据资料的全部信息; 如果对总体有充分的了解且足以确定其分布类型,非参数检验就不如参数检验具有更强的针对性,有效性会差一些; 目前还不能用于处理因素间的交互作用。 ;非参数检验并非要取代参数检验,而是作为参数检验的一个有力的补充。 与参数检验类似,非参数检验过程也是先根据问题提出原假设,然后利用统计学原理构造适当的统计量,最后利用样本数据计算统计量的概率p值,与显著性水平进行比较,得出拒绝或者接受原假设的结论。 ;卡方检验 二项分布检验 游程检验 单样本K-S检验 ;用于检验样本数据是否与某种概率分布的理论数值相符合,进而推断样本数据是否是来自于该分布的样本。 检验的过程,通常是先根据以往的经验或实际观测数据的分布情况,推测总体服从于某种分布,分布函数为F(x),然后再利用样本数据检验该总体的分布函数是否真的是 F(x)。 卡方检验直接检验的是实际频数与指定分布的频数是否相符。最典型的卡方检验统计量是Pearson统计量,其数学定义为: ;在进行n次相同的试验之后,出现0或者1???次数可以用离散型随机变量X表示,X值为1的概率设为p,X值为0的概率设为1 -p,形成二项分布。 二项分布检验通过样本数据来判断其总体是否服从概率为指定数值的二项分布。 在大样本中,采用Z检验统计量,在原假设成立的条件下,Z检验统计量近似服从正态分布,其数学定义为: ;游程检验的目的是检验取值为二分类,并且按照时间或者其他某种顺序排列的数列数值是否真的随机出现。 在一个连续符号排列中,所谓游程就是一个具有相同符号的连续串,在它前后相接的是与其不同的符号或者完全没有符号。 ;设 和 是分别来自同总体X和Y的随机样本数据,将这两个样本合在一起,并按照从小到大的顺序排列,得到次序统计量: 。如果将次序统计量中来自于总体X的样本值记为0,来自于总体Y的样本值记为1,仍然按照原顺序表示次序统计量,则得到了一个由0和1构成的序列。将连续出现0(或者连续出现1)的一组数分别称为0的游程(或者1的游程),一个游程中包含0(或者1)的个数成为游程长度。 ;在任一给定容量的样本中,游程的总数标志着样本是否是随机的。如果0和1是随机出现的,则出现连续的很多0或者连续的很多1的可能性很小,同时,0和1频繁交叉出现的可能性也很小。如果游程的数目很少,就意味着样本由于缺乏独立性而形成了一致的趋势或者成束结构;如果游程数目很多,则表明有系统的短周期波动影响观察结果。 游程检验是一种检验效能非常低的方法,它只利用了游程的数目,失去了绝大部分的信息,得出的隐性结论只供参考,如果有其它方法可供选择的时候,一般不要选择游程检验方法。 ;K-S检验是柯尔莫哥洛夫-斯米尔诺夫检验(Kolmogorov-Smirnov Test)的简称。 K-S检验就是一种可以对连续性数据进行分析的方法,可以利用样本数据推断样本来自的总体是否服从某一理论分布。 由于卡方拟合优度检验需要将样本空间分成不相交的子集,包含了较多的主观因素,特别是对于连续型总体,有可能会由于子集划分的不同而导致对同一样本得到对立的检验结果;而K-S检验方法在一定程度上克服了卡方检验的缺点,是比卡方检验更精确的一种非参数检验方法。 ;K-S检验是将观测量的累积分布函数与某个确定的理论分布函数相比较,以检验一个样本是否是来自于某指定分布的样本。 基本思路是:分别求出已知理论分布下的累积概率分布和观察的累积概率分布,对两者进行比较,从而确定两种分布的最大差异点。如果样本确实服从理论分布,那么差异值不应太高。 计算各样本观测值在理论分布中出现的累计概率值 F(x)和实际累计概率值S(x),并计算实际概率值与累计概率值

文档评论(0)

beautyeve + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档