对于“位置”的古典非参数检验 对于位置差异的检验有两种古典非参数检验方法: 用于独立的双样本—— Wilcoxon-Mann-Whitney rank-sum test——类似于标准Gaussian分布检验统计量。 用于成对的双样本—— Wilcoxon signed-rank test——类似于上述检验统计量对应的成对检验统计量。 Wilcoxon-Mann-Whitney rank-sum test 在1940s分别由Wilcoxon,以及Mann和Whitney发现。 该检验即resistance(不受异常值的影响),又robustness(如若检验满足t分布,也可采用该方法检验)。 对于独立的两数据(既不存在时间上的相关,也不为“pair”) Wilcoxon-Mann-Whitney rank-sum test 目标是检验两组数据位置差异是否显著: 给出原假设为:两数据位置(平均值)相同,来自于相同的分布; 可用单边或双边检验。 类似于t检验:如果序列间存在相关,则该序列方差将会增大,将可能会导致不恰当的拒绝原假设; Wilcoxon-Mann-Whitney rank-sum test 上述原假设的前提下,任何一个数据属于其中一组或另一组都是有可能的;两组数据属于同一个经验分布(即可交换性),它们的组合 组成这个经验分布; Rank-sum test statistic不是数据值本身的函数,而是数据排序后序号的函数,数据的基本分布并不重要。 Wilcoxon-Mann-Whitney rank-sum test 将2个样本数据混合并排序: 定义 为数据1的序号和; 定义 为数据2的序号和; 则有: 如果 ,则 和 应近似相等; 若两数据容量不相等,也应满足 和 近似相等; Wilcoxon-Mann-Whitney rank-sum test 在零假设下,n个数据按照2组观测数据容量的大小进行分配方式将会非常多,具体而言,可以有: (其对应的检验统计量构成零分布) 无论如何分配数据,如果观测的 和 在所有的分配方式中属于差异较大的一种分配方式,则拒绝零假设; Wilcoxon-Mann-Whitney rank-sum test 实际分析中采用Mann-Whitney U 统计量: 当两组观测样本容量均大于10,则可以建立近似于Gaussian分布的参数: Wilcoxon-Mann-Whitney rank-sum test——举例 Counts of cloud-to-ground lightning for experimentally seeded and nonseeded storms From Baughman et al. (1976), reproduced with permission of the American Meteorological Wilcoxon-Mann-Whitney rank-sum test——举例(续1) 播撒的雷暴个数: ,平均产生19.25个云对地的闪电; 非播撒的雷暴个数: ,平均产生69.45个云对地的闪电; 非Gaussian分布,有一个非常强的界外置(358),它使得样本标准差为98.93,因此采用t检验非常可能会产生错误的结果。 Wilcoxon-Mann-Whitney rank-sum test——举例(续2) Rank-sum test procedure using the cloud-to-ground lightning data Wilcoxon-Mann-Whitney rank-sum test——举例 原假设:两组数据来自相同分布,闪电个数相同,即播撒不影响闪电个数。 在Gaussian分布下: 查表得到:p值为0.014(通常拒绝零假设) 注:单侧检验,事先已知播撒可能会造成闪电次数减少。 Wilcoxon signed-rank test 使用于成对双样本( )位置差异检验; 检验统计量也是基于数据的排序,而不是原数据值,因此这种方法也不依赖于数据是否满足特定的分布; 考虑排序:该方法的排序过程基于成对数据差值绝对值的排序,即: :两样本来自同一分布 当原假设成立时,任何成对数据的差值( )出现正号和负号的机会应接近均等。 若数据对中存在 相等的情况,则平均分配rank
原创力文档

文档评论(0)