基于LASSO类方法的Ⅰ类错误的控制.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
·660· 空国卫生缠过!!!!生!旦箜丝鲞筮!塑 ·综述· 基于LASSO类方法的I类错误的控制。 山西医科大学卫生统计教研室(030001)许树红 王 慧 孙红卫 王 彤△ associationstud— 全基因组关联研究(genome—wide 有g;的不减函数,,在鸟,=g的条件下,E ies,GWAS)是在全基因组范围内同时研究上百万个[,(q1,.一,q枷)㈦=“]是不减的,后者为:对每一个风 nucleotide 单核苷酸多态性(single polymorphism,对应的P值P。及其不减函数,,在g,=/,t的条件下,E SNP)位点与疾病或某些性状之间的关联,从而筛选出 可能的致病SNP位点,进而对这些位点进行人群验证 样的方法。目前常用的控制I类错误的方法有两大 error 和实验分析。在GWAS研究中比较传统的分析方法类,分别是控制FWER(family—wiserate,FW— 是针对每个SNP和结局变量间关联进行单因素分析 ER)和控制FDR(falsediscoveryrate,FDR)。 的假设检验,而待分析的SNP数量有几十万甚至上百 设进行m次假设检验,原假设为H。;,i=1,…,m, 万个,使得检验次数十分巨大,如果不采用合适的方法 对应的P值表示为P,,i=1,…,m。将成立的H。对应 进行多重性校正来妥善控制I类错误,会产生许多假 的P值定义为g;,i=1,…,m。。表1是各种可能的检 阳性结果,对这些结果进行验证将耗费很多时问和财 验结果,m。和m,分别是检验中成立的Ho及不成立的 力,造成不必要的损失。针对全基因组测序数据进行 H0的个数。y是检验中成立的Ho被错误拒绝的个 多因素建模常采用的分析策略为降维和变量选择。变 数。仃。=m。/m,是m次假设检验中成立的Ho所占比 量选择的方法包括经典方法和惩罚类方法,惩罚类方 例。 法在GWAS研究、测序数据分析中应用广泛且发展迅 表1多重检验的结果 速,它假定模型具有稀疏性即真实情况下许多未知候 选变量的回归系数为0或者接近0,因此自变量的选 择问题转化为确定正确的子模型问题,且在选择变量 absolute 的同时给出模型参数的估计。LASSO(1east 1.控制FWER andselection shrinkage operator)作为一种常用的惩罚 FWER定义为至少犯一次I类错误的概率,,肝 类方法,部分研究者指出其选出的变量存在较高的假 阳性问题¨。o。针对该类问题,在多重校正以及变量 选择方法的基础上,发展了一些控制I类错误的同时 筛选出正确变量的方法。本文主要对多重检验中控制 I类错误的方法进行总结并且对基于LASSO的I类 m0 错误的控制方法进行综述。 mO ioL ’1 … z=l 多重检验中控制I类错误的策略和方法 =7roOL≤Od

您可能关注的文档

文档评论(0)

小马过河 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档