基于AdaBoost的基因组缺失变异综合检测策略.pdfVIP

  • 11
  • 0
  • 约1.64万字
  • 约 5页
  • 2017-08-09 发布于湖北
  • 举报

基于AdaBoost的基因组缺失变异综合检测策略.pdf

基于AdaBoost的基因组缺失变异综合检测策略.pdf

第44卷第5期 东南大 学 学报 (自然科学版) Vo1.44 NO.5 2014年 9月 JOURNALOFSOUTHEASTUNIVERSITY (NaturalScienceEdition) Sept.2014 doi:10.3969/j.issn.1001—0505.2014.05.009 基于AdaBoost的基因组缺失变异综合检测策略 高敬阳 管 瑞 (北京化工大学信息科学与技术学院,北京 100029) 摘要:针对基因组缺失变异检测 中测序序列分裂 比对方法所存在 的假发现率较高的问题,提出 了一种基于检测理论和AdaBoost的综合检测策略.首先,对配对末端测序序列进行初次映射和 二次分裂比对,得到1bp解析度的候选缺失变异集合,并使得该集合中包含尽可能多的候选变 异;然后,依据配对末端测序序列映射分析、测序序列分裂比对和测序序列映射深度分析 3类检 测方法的基本原理,在2次比对结果中提取与缺失变异相关的序列特征;最后,以具有高泛化性 能的AdaBoost神经网络集成模型为判别模型,筛除候选集 中的伪阳性结果,从而得到最终结果 集.实验结果表明,相对于传统的测序序列分裂比对方法,所提策略能够在几乎不损失检测敏感 度的前提下更加有效地降低假发现率. 关键词:缺失变异;二代测序;特征提取;AdaBoost 中图分类号 :Q523;TP274 文献标志码 :A 文章编号 :1001—0505(2014)0543924-05 IntegratedAdaBoost·basedstrategyfordetectionofgenom icdeletions GaoJingyang GuanRui (CollegeofInformationScienceandTechnology,BeijingUniversityofChemicalTechnology,Beijing100029,China) Abstract:T0solvetheproblem htathtefalsediscoveryrateofsplit—readapproachesforgenomicde. 1etiondetectionisrelativelyhigh,anintegratedstrategybasedondetectiontheoriesna dAdaBoostis proposed.First,afterinitialmappingand following splitreadalignmentofpaired—endreads,aset containinglbp—resolutiondeletioncandidatesasmanyaspossibleisidentified.Then,accordingto htefundamentalsofread—pairtechnologies。split.readapproachesandread.depht methods.deletion— relatedfeaturesareexrtactedbasedonhtetwoalignmentresults.Finaly,togetfinalcalls,na Ada. Boostneuralnetensemblemodelisgener~izedtodistinguish truefrom falsedeletion candidates. Theexperimentalresultsshow htatcomparedwiht htertaditionalsplit—readapproaches,hteproposed strategyCna reducehtenumberoffalsepositivesmoreeffectivelywithnegligiblelossofsensitivity. Keywords:deletion;next—generationsequencing;featureexrtaction;AdaBoost 个体基因组相较于参考基因组所发生部

文档评论(0)

1亿VIP精品文档

相关文档