整合分析中与非参数检验 重复取样检验法与实例应用.docVIP

整合分析中与非参数检验 重复取样检验法与实例应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
整合分析中的非参数检验:重复取样检验法的实例应用 郑凤英1,陆宏芳3,彭少麟2, 3* 1. 山东大学威海分校海洋生物工程系,山东 威海 264209;2. 中山大学生命科学学院生态与进化研究所,广东 广州 510275; 3. 中国科学院华南植物园,广东 广州 510650 摘要:整合分析(meta-analysis)是对同一主题下多个独立实验结果进行综合的统计学方法。非参数检验整合分析——重复取样检验(resampling test)不考虑原文献数据的分布形式,故可在不知原文献数据分布形式时使用。其中的靴襻法(bootstrap)可用来给出总效应值的置信区间,但不能检验组内异质性是否显著。靴襻法与随机检验法(randomization test)可以有效弥补这一缺失,判断出组间差异性是否显著。实例应用表明,重复取样检验没有参数检验保守,又与参数检验的结果差异较小。 关键词:整合分析;非参数检验;重复取样检验;靴襻法;随机检验法 中图分类号:Q141 文献标识码:A 文章编号:1672-2175(2004)04-0616-03 整合分析是对同一主题下多个独立研究(来源于不同的文献)进行综合的一种统计推断方法。它的基本思路是:第一步,先提出假设;第二步,根据原文献数据特点构造一个统计量[1],也称效应值,即将原文献数据转化为一个可在所有研究中进行比较的新统计量,并计算各研究的效应值;第三步,将所有研究的效应值结合起来,即根椐各效应值的方差进行权重,计算其加权平均效应值(即总效应值),并给出其置信区间,根据总效应值大小及其置信区间,可判断总效应值是否显著。显著与否代表所研究因素对实验对象有无影响,效应值正负代表影响的方向;第四步,计算所有研究间效应值的异质性,并进行显著性检验;第五步,按不同研究特点将独立研究分成不同的分组,比较不同分组间的总效应值及其总异质性,各分组及研究间的差异可用x2分布来检验。我们曾介绍了遵循上述统计推断思路的参数检验整合分析的计算方法[2],并进行了实例分析[3, 4]。 上述参数检验是在假设所有研究中的实验组和对照组观测值均遵循正态分布情况下进行的,许多整合分析方法基于大样本近似原理,即当实验组和对照组样本含量不小于10时,效应值才趋于正态分布。但如果样本太小,实验组和对照组样本含量太悬殊或效应值太大时,大样本近似原理就变得不准确了[5]。但事实上,许多生态学观察值违背了上述情况。此外,只有满足上述假设时,用于检验研究间效应值异质性的Q值才有近似的x2分布[5]。基于上述原因,Adams将最初只用于单个研究分析中的重复取样检验法(一种非参数检验法)引入了整合分析中[6]。本文在国内首次介绍整合分析中的重复取样检验方法,并以实例分析的形式对参数检验和非参数检验整合分析法进行比较。 1 重复取样检验法 重复取样检验法是取代传统参数和非参数检验的一种好的非参数检验方法,它庞大的计算必须依赖于计算机才能完成,它的基本思路为多次打乱数据的排列方式,每次都算出统计量值,然后得出这个统计量的分布,从而检验这个统计量的显著性,通过比较最初的统计量与后来产生的统计量分布形式可检验这个统计量的显著水平。重复取样检验中的随机检验(randomization test)常被用来决定一个统计量的显著性水平,而靴襻法(bootstrap)则用于给出统计量的置信区间,因为它们产生自己的分布形式,所以重复取样检验不受参数检验分布假设的影响,故在许多情况下,比传统的非参数检验排列法效率更高[6, 7]。 用靴襻法来计算所有研究总效应值和每一分组总效应值的置信区间,对于研究数为i的每一分组或研究数为i的所有研究,我们先算出其总效应值(即初值),然后以放回式取样选取i个研究并计算其总效应值(靴襻值),然后重复上述取样方法多次,按由小到大顺序将总效应值排列起来,在两端分别取2.5%处值作为95%置信区间上下限,置信区间包括零在内的分组被认为没有显著不等于零。用这种方法产生的置信区间叫百分靴襻法置信区间。这种置信区间假设靴襻值以初值为中心,如果此假设成立,则百分靴襻法就可产生正确的置信区间。当样本含量较小(即研究数少)时,往往会出现高于或低于初值的靴襻值数大于总靴襻值数50%的现象,此时可用偏差校正法(bias-corrected method)来校正,具体为:算出低于初值的靴襻值数占总靴襻值数的比例(F),用下式来较正即可。偏差校正后的百分置信区间的上下限取值范围为: Ф[2Ф-1(F)±Zα/2] (1)式中,Ф为标准正态分布函数,Ф-1为Ф的反函数,Zα/2为标准正态分布中的Z值,α为显著水平,一般取0.05,故Zα/2为1.96,如果F=0.5,代入(1)式得: Ф[2Ф-1()

文档评论(0)

bhyq + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档