生物统计学课件：统计方法.ppt

下载文档 降价啦

64
0
约6.47千字
约 56页
2021-05-19 发布于境外
举报
版权申诉
保障服务

生物统计学课件：统计方法.ppt

1、本文档共56页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

Points of Significance 3.Significance,P values and t-tests The P value reported by tests is a probabilistic significance, not a biological one. 许多检验用P值来作为度量一个结果的差异是否由随机因素造成的。 4.Power and sample size The ability to detect experimental effects is undermined in studies that lack power. 没有功效的研究中，检测实验效应的能力就被削弱了。统计检验的思想 Fig1c 统计把这种范围进行了量化，观测值x的统计显著性, 阴影部分的面积，这就是Pvalue。若是单侧的检验，就是dark 部分的面积统计检验的思想 P值经常误解为在计算P值的过程中，假设H0为真，x是从H0为真的分布下抽取的，P值如果比较小，如小于0.05，只是告诉我们，在这个假设下，一个不大可能发生的事件出现了，有理由拒绝H0，也就是接受备则的假设，认为样本不是来自均值为μ的总体。但是统计显著性并不表明生物学的显著性。假定总体服从均值为μ的正态分布，为得到其精确的形状接下来需要对其标准差进行估计。再独立的测4次，就得到一个容量为5的样本，假设它的平均值为 Fig2a 假设重复测量5次，均值为10.85，标准差sdx=0.96 并且假定总体的标准差就是sdx=0.96 Fig2b假设总体是正态分布，均值为μ=10, 并且假定总体的标准差就是sdx=0.96，s.e.m= Fig2c假设H0是正态分布，则其样本均值的抽样分布也为正态分布可用 (s.e.m.) 估计其sd 把标在分布图上，可得到其P值通过计算可以构造一个统计量 t的分布形状与正态分布非常接近，但与正态分布不一样，称之为Student’s t分布. 分布形状上的差异在于，对大多数样本来说，样本方差 S2往往小于总体的方差，或者说是低估了总体的方差，可以证明样本方差的分布是偏态分布。（下图为模拟实验）因为不对称性，n越小，得到的样本方差小于总体方差。也就出现t分布的尾部更高的现象。(Fig3 a) 模拟实验，从N(0,1)中抽取容量为5的样本，抽取2000次得到的方差的直方图，易知是偏态的 Fig3a 不同的样本容量下，t分布的密度与正态分布密度的比较， t分布尾部更高。随着n的增加，t分布越来越像正态。n越大， S2越接近于总体方差σ2 所以，如果不进行校正，不用t分布去做，而是用Fig2c 中的正态分布计算的话，将会高估他的显著性。例如：在Fig2b中用样本量为5的样本，t值为1.98,得到的p值为0.119.若用正态分布计算，得到p值为0.048.若t值不变，增加样本容量n=50,得到的p值为0.054.结果就与正态分布下的P值比较接近了。 Fig3b 不同的样本量下，P值与t统计量值的变化， n越小，P值的改变越大。分布之间的差异能够用实验效应来反映，效应的概率称为功效。功效：不犯第二类错误的概率,也称敏感性(sensitivity) Type I error:H0为真，拒绝H0，也称假阳性,False positive Type II error:H0为不真，接受H0,也称假阴性,False negative 功效对检验来说非常重要，但常常被忽视。当功效低，重要的效应可能检测不到，在一些有很多条件和结果的实验中，如组学实验，显著性结果中的一大部分结果可能是错的。 Fig1 有两组实验，一组50%有差异，另一组10%的差异若检验功效为0.2，说明会错过80%的真阳性结果，第一组实验阳性结果中的20%可能是错的，即阳性预测值(PPV)为0.8.（PPV=真阳性/检测为阳性）对于像基因表达研究实验中，有差异性的结果不到10% 是很常见的。若power=0.2,得到PPV=0.31,即阳性结果中超过2/3的结果是错的.即使用最常用的最低功效0.8，也有超过1/3的结果是错的(PPV=0.64). 当检验那种真实阳性结果很少的假设时（差异性很少的假设，如第二组实验），低功效的大多数阳性结果都是错的一个关于医学研究文献分析发现，在功效至少为80%，检测有阴性结果的试验中仅有36%的能够检测出50%有差异。近来有很多文献评论报导大多数研究是功效不足。在组学研究中，为降低假阳性率，做检验时就需要用很小的显著性水平，同时，功效很低和假阴性很高成为一个普遍的现象。当课题有潜在危