FDR校正.docVIP

  • 53
  • 0
  • 约2.02万字
  • 约 8页
  • 2016-08-24 发布于河南
  • 举报
FDR校正

根据Benjamini在他的文章中所证明的定理,控制fdr的步骤实际上非常简单。 The False Discovery Rate (FDR) of a set of predictions is the expected percent of false predictions in the set of predictions. For example if the algorithm returns 100 genes with a false discovery rate of .3 then we should expect 70 of them to be correct. The FDR is very different from a p-value, and as such a much higher FDR can be tolerated than with a p-value. In the example above a set of 100 predictions of which 70 are correct might be very useful, especially if there are thousands of genes on the array most of which are not differentially expressed. In contrast p-value of .3 is generally unacceptabe in any circumstance. Meanwhile an FDR of as high as .5 or even higher might be quite meaningful. ? 计算方法 请参考: http://stat.ethz.ch/R-manual/R-devel/library/stats/html/p.adjust.html ? p-c(0.0003,0.0001,0.02) p [1] 3e-04 1e-04 2e-02 p.adjust(p,method=fdr,length(p)) [1] 0.00045 0.00030 0.02000 p*length(p)/rank(p) [1] 0.00045 0.00030 0.02000 length(p) [1] 3 rank(p) [1] 2 1 3 sort(p) [1] 1e-04 3e-04 2e-02 1) P-value 是 (在H0 = true的情况下)得到和试验数据一样极端(或更极端)的统计量的概率. 它不是H1发生的概率. 假定吃苹果的一组和不吃苹果的一组的差异为D, P-value=0.2的意思是, pure randomly (即H0=true)的情况下, 观察到和D一样或比D更大的差异的概率是20%. 2) p-value 的本质是控制PFR (false positive rate), hypothesis test 的目的是make decision. 传统上把小概率事件的概率定义为0.05或0.01, 但不总是这样. 主要根据研究目的. 在一次试验中(注意:是一次试验, 即single test), 0.05 或0.01的cutoff足够严格了(想象一下, 一个口袋有100个球, 95个白的, 5个红的, 只让你摸一次, 你能摸到红的可能性是多大?). 我刚才强调的是single test, 在multiple test中, 通常不用p-value, 而采用更加严格的q-value. 与p-value 不同, q-value 控制的是FDR (false discovery rate). 3)举个例子.假如有一种诊断艾滋病的试剂, 试验验证其准确性为99%(每100次诊断就有一次false positive). 对于一个被检测的人(single test) 来说, 这种准确性够了. 但对于医院 (multiple test) 来说, 这种准确性远远不够, 因为每诊断10 000个个体, 就会有100个人被误诊为艾滋病. 4)总之, 如果你很care false positive, p-value cutoff 就要很低. 如果你很care false negative (就是宁可错杀一千, 也不能漏掉一个 情况), p-value 可以适当放松到 0.1, 0.2 都是可以的. ******************* Multiple testing的问题最近越来越火了:) 其实我一直有一个问题,从Benjamini开始,现在FDR的控制方法不下10种,为什么Storey的是最流行的?实际应用起来除了Be

文档评论(0)

1亿VIP精品文档

相关文档