- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
FDR校正
根据Benjamini在他的文章中所证明的定理,控制fdr的步骤实际上非常简单。
The False Discovery Rate (FDR) of a set of predictions is the expected percent of false predictions in the set of predictions. For example if the algorithm returns 100 genes with a false discovery rate of .3 then we should expect 70 of them to be correct.
The FDR is very different from a p-value, and as such a much higher FDR can be tolerated than with a p-value. In the example above a set of 100 predictions of which 70 are correct might be very useful, especially if there are thousands of genes on the array most of which are not differentially expressed. In contrast p-value of .3 is generally unacceptabe in any circumstance. Meanwhile an FDR of as high as .5 or even higher might be quite meaningful.
?
计算方法 请参考:
http://stat.ethz.ch/R-manual/R-devel/library/stats/html/p.adjust.html
?
p-c(0.0003,0.0001,0.02) p[1] 3e-04 1e-04 2e-02 p.adjust(p,method=fdr,length(p))[1] 0.00045 0.00030 0.02000 p*length(p)/rank(p)[1] 0.00045 0.00030 0.02000 length(p)[1] 3 rank(p)[1] 2 1 3sort(p)[1] 1e-04 3e-04 2e-02
1) P-value 是 (在H0 = true的情况下)得到和试验数据一样极端(或更极端)的统计量的概率. 它不是H1发生的概率. 假定吃苹果的一组和不吃苹果的一组的差异为D, P-value=0.2的意思是, pure randomly (即H0=true)的情况下, 观察到和D一样或比D更大的差异的概率是20%.2) p-value 的本质是控制PFR (false positive rate), hypothesis test 的目的是make decision. 传统上把小概率事件的概率定义为0.05或0.01, 但不总是这样. 主要根据研究目的. 在一次试验中(注意:是一次试验, 即single test), 0.05 或0.01的cutoff足够严格了(想象一下, 一个口袋有100个球, 95个白的, 5个红的, 只让你摸一次, 你能摸到红的可能性是多大?). 我刚才强调的是single test, 在multiple test中, 通常不用p-value, 而采用更加严格的q-value. 与p-value 不同, q-value 控制的是FDR (false discovery rate).3)举个例子.假如有一种诊断艾滋病的试剂, 试验验证其准确性为99%(每100次诊断就有一次false positive). 对于一个被检测的人(single test) 来说, 这种准确性够了. 但对于医院 (multiple test) 来说, 这种准确性远远不够, 因为每诊断10 000个个体, 就会有100个人被误诊为艾滋病.4)总之, 如果你很care false positive, p-value cutoff 就要很低. 如果你很care false negative (就是宁可错杀一千, 也不能漏掉一个 情况), p-value 可以适当放松到 0.1, 0.2 都是可以的.*******************
Multiple testing的问题最近越来越火了:)其实我一直有一个问题,从Benjamini开始,现在FDR的控制方法不下10种,为什么Storey的是最流行的?实际应用起来除了Be
您可能关注的文档
- 安全卡瓦结构.doc
- 硝酸钠安全技术说明书修改.doc
- 10.3.2解二元一次方程组.doc
- 七年级人教版下第十章二元一次方程组复习教案2.doc
- 。。。。。。.doc
- 二元一次方程组--备课讲义.doc
- 缺铁贫.ppt
- PCA101-设备CIP作业管理指导书.doc
- 制冷剂介绍.ppt
- 硝酸钠安全技术说明书(MSDS).doc
- 光纤数字通信调试工考试《中级光纤数字通信调试工必看题库知识点》模拟卷.doc
- 光纤数字通信调试工考试《中级光纤数字通信调试工题库考点》模拟练习卷.doc
- 超深防渗墙施工工艺、质量通病及控制要点)五星.pptx
- 苏科版八年级上册数学精品教学课件 第4章 实数 4.3 实数 第2课时 实数的运算.ppt
- 苏科版八年级上册数学精品教学课件 第3章 勾股定理 3.1 勾股定理 第1课时 认识勾股定理.ppt
- 苏科版八年级上册数学精品教学课件 第6章 一次函数 6.3 一次函数的图像 第2课时 一次函数的性质.ppt
- 苏科版八年级上册数学精品教学课件 第4章 实数 章末回顾与整合提升.ppt
- 苏科版八年级上册数学精品教学课件 第1章 1.3.1 用“边角边”判定三角形全等.ppt
- 苏科版八年级上册数学精品教学课件 第6章 全章热门考点整合应用.ppt
- 苏科版八年级上册数学精品教学课件 第2章 轴对称图形 2.5 等腰三角形的轴对称性 第2课时 等腰(等边)三角形的判定与性质.ppt
最近下载
- 中华民族共同体概论课件第八讲共奉中国与中华民族聚力发展.pptx VIP
- 一种碱性磷酸酶标记抗体或抗原的方法.pdf VIP
- 2024-2025部编人教版小学语文1一年级上册(全册)优秀课件.ppt
- 手术室PDCA——提高急诊手术器械物品准备的完善率.pptx VIP
- 宠物行业宠物智能喂食器研发方案.doc VIP
- 老年人徒手肌力评定健康促进课件.pptx VIP
- TPM管理培训课件.pptx VIP
- 中华民族共同体概论大讲堂课件第七讲华夷一体与中华民族空前繁盛(隋唐五代时期).pdf VIP
- 灰库系统钢结构加固施工方案.docx VIP
- 2025至2030中国中医馆行业市场发展分析及前景趋势与投资机会报告.docx
文档评论(0)