人人都该知道的统计相关性知识.docVIP

  • 14
  • 0
  • 约5.59千字
  • 约 5页
  • 2016-01-07 发布于湖北
  • 举报
人人都该知道的统计相关性知识.doc

人人都该知道的统计相关性知识 蔡立英/编译 ● 一个寻常的分析错误会阻碍生物医学研究并误导公众。 2012年,《新英格兰医学杂志》刊登了一篇论文,声称吃巧克力可以提高认知功能。得出这一结论的根据是每个国家的诺贝尔奖得主数量与该国巧克力人均消费量具有强相关性。当我读到这篇论文时,我诧异于它竟然通过了同行评审,因为对我而言很显然作者犯了两个常见错误,这是我在生物医学文献中看到研究者进行相关分析时经常犯的错误。 相关性描述了两个观察现象之间的线性关系强度(为了简化说明,这里我着重阐述最常用的线性关系——皮尔森相关)。例如,一个变量值的增加,比如巧克力消费量,可能会跟随着另一个变量值的增加而增加,比如诺贝尔奖得主。或者可能是负相关:一个变量的增加会伴随另一个变量的减少。因为有可能两个数值不能用相同单位表示的变量关联起来——例如,人均收入和霍乱发病率——它们的关系是用一个无单位的数值来计算的,那就是相关系数。相关系数的数值范围是从-1到+1,绝对值越接近1,则表示相关性越强。 相关系数鲜明的简洁性隐藏了解释其意义时面临的相当大的复杂性。《新英格兰医学杂志》那篇论文的一个错误是,作者在群体数据的基础上得出关于个体的结论时,陷入了生态学谬误中。这个案例中,作者计算了集合层面(国家)的相关系数,然后错误地把这个数值用于得出关于个体层面的结论(吃巧克力提高认知功能)。实际上,个体层面的准确数据完全是

文档评论(0)

1亿VIP精品文档

相关文档