- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
FDR校正
根据Benjamini在他的文章中所证明的定理,控制fdr的步骤实际上非常简单。
The False Discovery Rate (FDR) of a set of predictions is the expected percent of false predictions in the set of predictions. For example if the algorithm returns 100 genes with a false discovery rate of .3 then we should expect 70 of them to be correct.
The FDR is very different from a p-value, and as such a much higher FDR can be tolerated than with a p-value. In the example above a set of 100 predictions of which 70 are correct might be very useful, especially if there are thousands of genes on the array most of which are not differentially expressed. In contrast p-value of .3 is generally unacceptabe in any circumstance. Meanwhile an FDR of as high as .5 or even higher might be quite meaningful.
?
计算方法 请参考:
http://stat.ethz.ch/R-manual/R-devel/library/stats/html/p.adjust.html
?
p-c(0.0003,0.0001,0.02) p[1] 3e-04 1e-04 2e-02 p.adjust(p,method=fdr,length(p))[1] 0.00045 0.00030 0.02000 p*length(p)/rank(p)[1] 0.00045 0.00030 0.02000 length(p)[1] 3 rank(p)[1] 2 1 3sort(p)[1] 1e-04 3e-04 2e-02
1) P-value 是 (在H0 = true的情况下)得到和试验数据一样极端(或更极端)的统计量的概率. 它不是H1发生的概率. 假定吃苹果的一组和不吃苹果的一组的差异为D, P-value=0.2的意思是, pure randomly (即H0=true)的情况下, 观察到和D一样或比D更大的差异的概率是20%.2) p-value 的本质是控制PFR (false positive rate), hypothesis test 的目的是make decision. 传统上把小概率事件的概率定义为0.05或0.01, 但不总是这样. 主要根据研究目的. 在一次试验中(注意:是一次试验, 即single test), 0.05 或0.01的cutoff足够严格了(想象一下, 一个口袋有100个球, 95个白的, 5个红的, 只让你摸一次, 你能摸到红的可能性是多大?). 我刚才强调的是single test, 在multiple test中, 通常不用p-value, 而采用更加严格的q-value. 与p-value 不同, q-value 控制的是FDR (false discovery rate).3)举个例子.假如有一种诊断艾滋病的试剂, 试验验证其准确性为99%(每100次诊断就有一次false positive). 对于一个被检测的人(single test) 来说, 这种准确性够了. 但对于医院 (multiple test) 来说, 这种准确性远远不够, 因为每诊断10 000个个体, 就会有100个人被误诊为艾滋病.4)总之, 如果你很care false positive, p-value cutoff 就要很低. 如果你很care false negative (就是宁可错杀一千, 也不能漏掉一个 情况), p-value 可以适当放松到 0.1, 0.2 都是可以的.*******************
Multiple testing的问题最近越来越火了:)其实我一直有一个问题,从Benjamini开始,现在FDR的控制方法不下10种,为什么Storey的是最流行的?实际应用起来除了Be
您可能关注的文档
- 安全卡瓦结构.doc
- 硝酸钠安全技术说明书修改.doc
- 10.3.2解二元一次方程组.doc
- 七年级人教版下第十章二元一次方程组复习教案2.doc
- 。。。。。。.doc
- 二元一次方程组--备课讲义.doc
- 缺铁贫.ppt
- PCA101-设备CIP作业管理指导书.doc
- 制冷剂介绍.ppt
- 硝酸钠安全技术说明书(MSDS).doc
- 经颅多普勒超声声学造影检查课件.ppt
- 考点11被动语态-2022年中考英语考点帮学及题型分类突破练原卷版.docx
- 浙江国企招聘-2025温州市城市建设发展集团有限公司面向社会招聘工作人员21人考试模拟卷附答案解析.docx
- 2026云南省楚雄监狱警务辅助人员招聘19人考试模拟卷附答案解析(夺冠).docx
- 2025山东菏泽市公安局招录警务辅助人员心理素质测评考试历年真题汇编附答案解析(夺冠).docx
- 2026河南省定向哈尔滨工业大学选调应届优秀毕业生考试参考题库带答案解析.docx
- 2025安徽工程大学专职辅导员招聘10人(第二批)考试历年真题汇编附答案解析.docx
- 2025年湖南怀化中共芷江侗族自治县委办公室选调1人考试模拟卷附答案解析(夺冠).docx
- 安全生产事故考核规定.doc
- 第十一讲--发展中国家面临艰难抉择-国际政治经济学.ppt
最近下载
- 监理取费标准(670号文件).pdf VIP
- 挖掘机故障排查和维护指南.docx VIP
- 利用单位圆的性质研究正弦函数、余弦函数的性质 说课课件 【高效备课 精讲精研】 高一上学期数学人教A版(2019)必修第一册.pptx VIP
- GB_T23694-2013:风险管理术语.pdf VIP
- 2023年江苏省中等职业学校学生学业水平考试商务营销类专业基本技能考试实施方案.docx VIP
- DGTJ 08-205-2024居住建筑节能设计标准.pdf VIP
- DCC1600冷室压铸机说明书.pdf VIP
- 制药设备与工程设计复习资料(总结).pdf VIP
- DB33_T1074-2010:城镇道路工程施工质量评价标准.pdf VIP
- 自进式管棚施工方案.pdf
原创力文档


文档评论(0)