- 53
- 0
- 约2.02万字
- 约 8页
- 2016-08-24 发布于河南
- 举报
FDR校正
根据Benjamini在他的文章中所证明的定理,控制fdr的步骤实际上非常简单。
The False Discovery Rate (FDR) of a set of predictions is the expected percent of false predictions in the set of predictions. For example if the algorithm returns 100 genes with a false discovery rate of .3 then we should expect 70 of them to be correct.
The FDR is very different from a p-value, and as such a much higher FDR can be tolerated than with a p-value. In the example above a set of 100 predictions of which 70 are correct might be very useful, especially if there are thousands of genes on the array most of which are not differentially expressed. In contrast p-value of .3 is generally unacceptabe in any circumstance. Meanwhile an FDR of as high as .5 or even higher might be quite meaningful.
?
计算方法 请参考:
http://stat.ethz.ch/R-manual/R-devel/library/stats/html/p.adjust.html
?
p-c(0.0003,0.0001,0.02) p[1] 3e-04 1e-04 2e-02 p.adjust(p,method=fdr,length(p))[1] 0.00045 0.00030 0.02000 p*length(p)/rank(p)[1] 0.00045 0.00030 0.02000 length(p)[1] 3 rank(p)[1] 2 1 3sort(p)[1] 1e-04 3e-04 2e-02
1) P-value 是 (在H0 = true的情况下)得到和试验数据一样极端(或更极端)的统计量的概率. 它不是H1发生的概率. 假定吃苹果的一组和不吃苹果的一组的差异为D, P-value=0.2的意思是, pure randomly (即H0=true)的情况下, 观察到和D一样或比D更大的差异的概率是20%.2) p-value 的本质是控制PFR (false positive rate), hypothesis test 的目的是make decision. 传统上把小概率事件的概率定义为0.05或0.01, 但不总是这样. 主要根据研究目的. 在一次试验中(注意:是一次试验, 即single test), 0.05 或0.01的cutoff足够严格了(想象一下, 一个口袋有100个球, 95个白的, 5个红的, 只让你摸一次, 你能摸到红的可能性是多大?). 我刚才强调的是single test, 在multiple test中, 通常不用p-value, 而采用更加严格的q-value. 与p-value 不同, q-value 控制的是FDR (false discovery rate).3)举个例子.假如有一种诊断艾滋病的试剂, 试验验证其准确性为99%(每100次诊断就有一次false positive). 对于一个被检测的人(single test) 来说, 这种准确性够了. 但对于医院 (multiple test) 来说, 这种准确性远远不够, 因为每诊断10 000个个体, 就会有100个人被误诊为艾滋病.4)总之, 如果你很care false positive, p-value cutoff 就要很低. 如果你很care false negative (就是宁可错杀一千, 也不能漏掉一个 情况), p-value 可以适当放松到 0.1, 0.2 都是可以的.*******************
Multiple testing的问题最近越来越火了:)其实我一直有一个问题,从Benjamini开始,现在FDR的控制方法不下10种,为什么Storey的是最流行的?实际应用起来除了Be
您可能关注的文档
- 安全卡瓦结构.doc
- 硝酸钠安全技术说明书修改.doc
- 10.3.2解二元一次方程组.doc
- 七年级人教版下第十章二元一次方程组复习教案2.doc
- 。。。。。。.doc
- 二元一次方程组--备课讲义.doc
- 缺铁贫.ppt
- PCA101-设备CIP作业管理指导书.doc
- 制冷剂介绍.ppt
- 硝酸钠安全技术说明书(MSDS).doc
- 河北盐山中学等校2025-2026学年上学期高三一模化学试卷(含解析).docx
- 河北正定中学2025-2026学年高一上学期期末考试物理试卷(含解析).docx
- 河北张家口市怀安县2025-2026学年第一学期期末教学综合评价八年级地理试卷(含解析).docx
- 河南安阳市殷都区2025-2026学年第一学期期末教学质量检测七年级地理试卷(含解析).docx
- 河南安阳市滑县2025一2026学年第一学期期末学业质量监测八年级地理试题(含解析).docx
- 河南安阳市林州市2025-2026学年上学期期末考试高一政治试题(含解析).docx
- 河南焦作市武陟县第一中学2025-2026学年高一上学期1月月考语文试卷(含解析).docx
- 河南济源市2025-2026学年上学期期末学业质量调研七年级历史试卷(含解析).docx
- PICC导管并发症的紧急处理与护理.pptx
- 河南鹤壁市2025-2026学年高二上学期期末考试生物试题(含解析).docx
原创力文档

文档评论(0)