生物统计学课件:统计方法.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Points of Significance 3.Significance,P values and t-tests The P value reported by tests is a probabilistic significance, not a biological one. 许多检验用P值来作为度量一个结果的差异是否由随机因素造成的。 4.Power and sample size The ability to detect experimental effects is undermined in studies that lack power. 没有功效的研究中,检测实验效应的能力就被削弱了。 统计检验的思想 Fig1c 统计把这种范围进行了量化, 观测值x的统计显著性, 阴影部分 的面积,这就是Pvalue。若是单侧的检验,就是dark 部分的面积 统计检验的思想 P值经常误解为 在计算P值的过程中,假设H0为真,x是从H0为真的 分布下抽取的,P值如果比较小,如小于0.05,只是 告诉我们,在这个假设下,一个不大可能发生的事件 出现了,有理由拒绝H0,也就是接受备则的假设,认为 样本不是来自均值为μ的总体。 但是统计显著性并不表明生物学的显著性。 假定总体服从均值为μ的正态分布,为得到其精确的形状 接下来需要对其标准差进行估计。再独立的测4次,就 得到一个容量为5的样本,假设它的平均值为 Fig2a 假设重复测量5次,均值为10.85,标准差sdx=0.96 并且假定总体的标准差就是sdx=0.96 Fig2b假设总体是正态分布,均值为μ=10, 并且假定总体的标准差就是sdx=0.96,s.e.m= Fig2c假设H0是正态分布,则其样本均值的抽样分布 也为正态分布 可用 (s.e.m.) 估计其sd 把 标在分布图上,可得到其P值 通过计算可以构造一个统计量 t的分布形状与正态分布非常接近,但与正态分布不一样, 称之为Student’s t分布. 分布形状上的差异在于,对大多数样本来说,样本方差 S2往往小于总体的方差,或者说是低估了总体的方差, 可以证明样本方差的分布是偏态分布。(下图为模拟实验) 因为不对称性,n越小,得到的样本方差小于总体方差。 也就出现t分布的尾部更高的现象。(Fig3 a) 模拟实验,从N(0,1)中抽取容量为5的样本, 抽取2000次得到的方差的直方图,易知是偏态的 Fig3a 不同的样本容量下,t分布的密度与正态分布密度的比较, t分布尾部更高。随着n的增加,t分布越来越像正态。n越大, S2越接近于总体方差σ2 所以,如果不进行校正,不用t分布去做,而是用Fig2c 中的正态分布计算的话,将会高估他的显著性。例如: 在Fig2b中用样本量为5的样本,t值为1.98,得到的p值 为0.119.若用正态分布计算,得到p值为0.048.若t值 不变,增加样本容量n=50,得到的p值为0.054.结果 就与正态分布下的P值比较接近了。 Fig3b 不同的样本量下,P值与t统计量值的变化, n越小,P值的改变越大。 分布之间的差异能够用实验效应来反映,效应 的概率称为功效。 功效:不犯第二类错误的概率,也称敏感性(sensitivity) Type I error:H0为真,拒绝H0,也称假阳性,False positive Type II error:H0为不真,接受H0,也称假阴性,False negative 功效对检验来说非常重要,但常常被忽视。 当功效低,重要的效应可能检测不到,在一些有很多 条件和结果的实验中,如组学实验,显著性结果中的 一大部分结果可能是错的。 Fig1 有两组实验,一组50%有差异,另一组10%的差异 若检验功效为0.2,说明会错过80%的真阳性结果, 第一组实验阳性结果中的20%可能是错的, 即阳性预测值(PPV)为0.8.(PPV=真阳性/检测为阳性) 对于像基因表达研究实验中,有差异性的结果不到10% 是很常见的。若power=0.2,得到PPV=0.31,即阳性结果 中超过2/3的结果是错的.即使用最常用的最低功效0.8, 也有超过1/3的结果是错的(PPV=0.64). 当检验那种真实阳性结果很少的假设时(差异性很少的假 设,如第二组实验), 低功效的大多数阳性结果都是错的 一个关于医学研究文献分析发现,在功效至少为80%, 检测有阴性结果的试验中仅有36%的能够检测出50%有差异。 近来有很多文献评论报导大多数研究是功效不足。 在组学研究中,为降低假阳性率,做检验时就需要用很小的 显著性水平,同时,功效很低和假阴性很高成为一个普遍的现象。 当课题有潜在危

文档评论(0)

学习让人进步 + 关注
实名认证
内容提供者

活到老,学到老!知识无价!

1亿VIP精品文档

相关文档