- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语言统计第十一章 非参数检验
第十一章 非参数检验 我们前面讨论过的假设检验都属于参数检验。我们在第七章里谈到,这类检验的使用条件十分“苛刻”,比如所涉及的变量必须是等距变量、总体分布必须呈正态 总体的方差必须相等。但是在语言研究中,经常会遇到上述条件不能满足的情况,这时非参数检验就可以发挥作用了。但是需要注意,虽然在使用非参数检验时,不要求总体呈正态分布以及总体方差相等,但是仍然要求样本是随机样本,观测值是独立的。本章介绍几个最常用的非参数检验。 第一节 曼惠特尼U检验 一、 曼惠特尼U检验的用途和使用条件 检验用来比较两个独立样本,以决定两者之间是否存在 曼惠特尼检验的使 整体上的显著差异。该检验对应于独立样本 检验, 适用于用条件没有满足的情况。它对样本容量、 体分布等没有什么要求,只要 总求样本为随机样本, 数据为顺序数据, 但即使如此, 对随机性的要求也没有 检验那么严格。 检验的有效性不亚于 检验,再加上检验统计值易于计算,因而是一个很常用的检验。 决定使用哪个检验: 原则—当使用t检验的条件满足时,应尽量使用t检验,因为它毕竟能更充分地利用数据中的信息,因而能更容易发现总体之间存在的真正差异。 总之,如果t检验的条件得到了满足或基本满足,就尽量使用t检验,反之,如果数据为顺序数据,或虽是等距数据,但所来自的总体严重偏态,就应使用U检验。 二、曼惠特尼U检验的基本原理 U检验的零假设为:所比较的两个样本来自具有相同分布的总体 (至于分布的形状则无关紧要) 。 该检验的原理是: 如果零假设成立, 那么如果把两样本合并起来,按大小给每一个观测值一个等级,那么来自两样本的观测值就会随机分布在等级序列上,把两样本的观测值所占的等级分别累加起来,两个和应该相同或很接近。但是如果两样本之间存在显著差异, 那么一个样本的观测值就会主要占据等级序列的高 (上) 端, 而另一样本则主要占据低(下)端,因而两个和就会差别很大。该检验就是用来计算一下,在零假设成立的情况下,两和之间存在差异的概率。 第四步:求小样本的等级之和T(如果两样本容量相等,则计算任一样本的等级之和都可)。把小样本的数值个数计为N1, 大样本的数值个数计为 N2, 然后用下列公式计算U1和U2的值。 第五步:将U1和U2中较小的值用作检验统计值U与附表7中 的临界值加以比较。如果U等于或小于临界值,就可以推翻零假设。 例如,有两篇文章,我们想了解其难度是否有差异。我们随机选取15个被试,再随机将其分为A和B两组(A组7人,B组8人),然后让他们分别阅读这两篇文章,并在一个等级量表上给所读文章的难度打分,1表示“极易”,10表示“极难”。打分结果如表11.1所示。 假如想知道这两组数据之间在5%的显著水平上是否有显著差异(双尾检验) , 检验步骤如下: 第一步:零假设: H0两组分数没有差异。 H1两组分数有差异(双尾检验) 第二步:设显著水平为0.05。 第三步:把两组数据放在一起排序: 第五步:因U1(6.5)较小,所以把它作为检验统计值U。查附表7得临界10(N1=7,N2=8,a=0.05)。由于U值小于临界值,所以零假设被推翻,证明两组分数之间存在显著差异。附表7中给出的最大的N1和N2值只有20,这是因为对于大于这个值的样本,检验统计值U大体服从正态分布,这时就可以用Z作为检验统计值,其计算公式是 第二节 威尔柯克斯符号秩和检验与符号检验 曼惠特尼U检验是对应于独立样本t检验的一个非参数检验,而对 应于成对样本(或相关样本)t检验的非参数检验有两个:一个是威尔柯克斯符号秩和检验;另一个是符号检验。前者适用于等距数据,后者适用于顺序数据。两个检验的数据都是由一对对观测值构成的,所检验的零假设也相同,即两个变量的分布相同。但作为非参数检验,它们对变量的分布的形状都没有什么要求。 一、威尔柯克斯符号秩和检验 威尔柯克斯符号秩和检验的原理与曼惠特尼U检 验很相似: 先计算每一对观测值的差,如果零假设成立,即两样本所来自的总体的分布之间没有差异,那么正差与负差的个数应该大体相等,而且正差之和与负差之和也应大休相等;但是如果总体分布有差异,则正差与负差的个数以及正差之和与负差之和就会有差异。威尔柯克斯符号秩和检验的目的就是检验一下这一差异是否有显著意义。 检验步骤如下: 第一步: 陈述零假设H0和备择假设H1 第二步: 设定显著水平a 第三步:计算每一对观测值之差,并记下差的符号(即正值还是负值) 。 第四步:不考虑差的正负号,按其绝对值从小到大排序(即赋予每个差一个 “秩” ) 。 如果差为零,
文档评论(0)