第四章-序列比对与算法.ppt

. 多序列比对与进化研究例子 图中NYLS为树根 一个多序列比对例子 VTISCTGSSSNIGAG-NHVKWYQQLPG VTISCTGTSSNIGS--ITVNWYQQLPG LRLSCSSSGFIFSS--YAMYWVRQAPG LSLTCTVSGTSFDD--YYSTWVRQPPG PEVTCVVVDVSHEDPQVKFNWYVDG-- ATLVCLISDFYPGA--VTVAWKADS-- AALGCLVKDYFPEP--VTVSWNSG--- VSLTCLVKGFYPSD--IAVEWWSNG-- 多序列比对方法 全局序列比对 动态规划算法 (Dynamic Programming Algorithm) 分而治之方法 (Divide and Conquer Methods) SP方法 (Sum of Pairs Methods) 累进方法 (Progressive Methods) 迭代方法 (Iterative Methods) 局部序列比对 概形分析 (Profile Analysis) 区块分析 (Block Analysis) 统计学方法 (Statistical Methods) 在多序列比对前要考虑的问题 比对的优劣与序列条数正相关 每个亚群应分别先比对,然后再整体比对 一、全局序列比对 动态规划算法 (Dynamic Programming Algorithm) 分而治之方法 (Divide and Conquer Methods) SP方法 (Sum of Pairs Methods) 累进方法 (Progressive Methods) 迭代方法 (Iterative Methods) 遗传算法 (Genetic Algorithms) 序列长度为 n 的双序列比对 n2 比对 比对数目成指数增长 例如:序列长度为n,序列数为N 的多序列比对数目是nN 对于数目较少且较短的序列来说都不切实际 1.动态规划算法(Dynamic Programming) Sequence 1 Sequence 2 Sequence 3 多维的动态规划算法 分而治之 (Divide and Conquer, DCA)方法 将MSA(Measurement System Analysis)的空间复杂度减小 DCA在线MSA http://bioweb.pasteur.fr/seqanal/interfaces/dca-simple.html  2. 分而治之方法 So in effect … Sequence 1 Sequence 2 Sequence 3 3. SP(Sum of Pairs)方法 为了找到最佳比对,并解决动态规则算法的计算复杂问题,Carrillo Lipman (1988)发明了SP (Sum of Pairs)方法 SP方法通过对一个随机数据矩阵中氨基酸对的所有可能组合的记分求和来获得矩阵记分 4. 累进算法(Progressive Methods) 针对基于动态规划算法的MSA程序比对序列数目有限, Feng Doolittle(1987)发明了累进算法 CLUSTAL 和 PILEUP 是目前常用的基于累进算法的比对软件 CLUSTAL 是免费软件,目前应用非常广泛 http://www-igbmc.u-strasbg.fr/BioInfo/ClustalX/Top.html 1 对所有序列做双序列比对,构建距离矩阵计算相似性分数值 2 基于双序列距离矩阵, 构建一个进化树 Scer Cele   Dmel Mouse  Human 3 依据进化树进行渐进比对 ? 依据进化树,开始对关系较 近的序列进行两两比对 ? 逐渐加入关系较远的序列进行比对 ? 构建多序列比对 Multiple alignment Scerevisiae [1] Celegans [2] 0.640 Drosophia [3] 0.634 0.327 Human [4] 0.630 0.408 0.420 Mouse [5] 0.619 0.405 0.469 0.289 累进算法原理 一般累进比对方法 1 3 2 5 1 3 1 3 1 3 2 5 2 5 4 d root 果仁糖累进方法 (Praline progressive strategy) 1 3 2 1 3 1 3 1 3 2 5 2 5 4 d 4 累进算法的一些问题 比对的准确性高度依赖于开始选择的双序列比对 序列关系越远发生的错误可能越高 选择合适的打分矩阵和罚分

文档评论(0)

1亿VIP精品文档

相关文档