生物信息学04讲解.ppt

  1. 1、本文档共72页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 激酶的多序列比对 4. 隐马尔科夫模型: ProbCons 主要改进: 1. 所有序列的两两比对,通过profile HMM的方法进行双序列比对; 2. 将渐进算法与迭代算法整合; 3. 目前,性能最优。 5. 整合算法MUSCLE 算法分为三个部分,每个部分相对独立; 1. Draft progressive: 1 对两条序列,计算距离采用k-mer的思想; 2 用UPGMA算法构建引导树; 3 使用渐进算法进行多序列比对; 优点:两条序列之间的距离不采用动态规划算法进行比对,节省时间。 MUSCLE 2. Improved progressive: 1 基于k-mer得到的树可能会产生次优结果,因此,采用Kimura距离的方法对k-mer产生的树重新计算距离矩阵; 2 重新用UPGMA构建进化树; 3 使用渐进算法进行多序列比对; 3. Refinement: 1 随机从进化树上挑出一条边,删除; 2 得到两组树,对每组树,计算profile; 3 将两组profile进行比对; 4 如果最终得分提高,保留结果,否则丢弃。 MUSCLE MUSCLE的算法流程 MUSCLE: 使用指南 /muscle/ MUSCLE的使用 多序列比对:性能检验 1. BAliBASE:基于蛋白质结构,将同一家族的蛋白质序列进行多序列比较。 2. 检验多序列比对工具的性能:是否能够很好的重复BAliBASE中已明确的比对结果。 AMP结合酶的结构/序列比较 性能比较 ProbCons:目前综合性能最好; T-Coffee:序列相似性高时最准确; DIALIGN: 序列相似性低时最准确; POA:性能接近T-Coffee和DIALIGN,速度最快; ClustalW/X: 最经典、被广泛接受的工具; MUSCLE: 目前最流行的多序列比对工具; 运算时间比较 * * * * * * * * * * * * * * * * * * * * 双序列比对 Gap V D S C Y Gap 0 -11 -22 -33 -44 -55 V -11 4 -7 -18 -29 -40 E -22 -7 6 -5 -16 -27 S -33 -18 -5 10 -1 -12 L -44 -29 -16 -1 9 -3 C -55 -40 -27 -12 8 7 Y -66 -51 -38 -23 -3 15 4 2 时间复杂度:O n2 多序列比对:最优算法 三条序列:时间复杂度:O lmn O n3 四条序列:时间复杂度:O n4 ,非多项式时间! 多项式时间复杂度要求:≤O n3 m条序列:时间复杂度:O nm ,NPC问题! … 动态规划算法:全空间 动态规划算法:优化算法 Sequence A Sequence B Sequence C 搜索有限空间,类似于BLAST算法 动态规划算法:Hyperlattice 注意 最优的多序列比对,其两两序列之间的比对不一定最优。 最优的多序列比对 非最优的双序列比对 MSA程序 MSA - Multiple Sequence Alignment David Lipman等,1989年初始开发; 应用多维动态规划算法,得到最优的全局比对。 工具资源: /CBBresearch/Schaffer/msa.html /general/software/packages/msa/manual/manual.php MSA: 打分方式 多序列比对:方法改进 1. 渐进方法:progressive methods 代表:ClustalW/X, T-Coffee 2. 迭代方法:iterative methods 代表: PRRP, DIALIGN 3. 部分有向图算法: Partial Order Algorithm POA 4. 全局多序列比对的隐马尔科夫模型 profile HMM 5. 整合算法: MUSCLE 1. Progressive methods 1 ClustalW/X 2 T-Coffee 1 ClustalW/X 1. Clustal: 1988年开发; 2. ClustalW: 1994年,Julie D. Thompson等人改进、发展; 3. ClustalX: 1997年,图形化软件; ClustalW/X:计算过程 1. 将所有序列两两比对,计算距离矩阵; 2. 构建邻接进化树 neighbor-j

文档评论(0)

118118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档