第2章配对序列比对2bak教案.docVIP

  • 15
  • 0
  • 约1.31万字
  • 约 20页
  • 2016-06-08 发布于湖北
  • 举报
第四节 全局序列比对(Global Sequence Alignment) 在介绍全局比对之前,我们得首先说明的是对任何比对方法(包括全局比对,局部比对)主要包括两部分: 第一部分就是计算最大相似得分数,也就是这两个序列比对的最优化计算过程。 第二部分是在根据这个最大相似得分数,通过“回溯”方式确定两个序列的比对结果即第一个序列中的各字符(在DNA中为对应的碱基,在蛋白质中为对应的氨基酸残基)与第二个序列中哪个字符相匹配。通过这个结果可以确定相应保守区,可变区,这样据此可推断这两个序列是否有同源关系以及其同源性程度。这部分工作在比对中一般称为“回溯”(traceback)。 我们首先考虑两个序列 和 ,现在要求解的问题是如何通过计算求出这两个序列的比对结果,以确定其相似程度。 为使读者对比较容易理解全局比对的算法,我们这里通过一个具体例子的计算来说明。由于蛋白质有20个氨基酸残基,相应的得分表比较复杂,为此我们这里的例子采用一小段DNA序列来说明其具本计算过程。 实例,两个序列S=ACCTGA 和T=CATGTAT,对应的得分矩阵假设为: 表2-3 四个碱基的得分矩阵 A T C G * A 2 -1 -1 -1 -1 T -1 2 -1 -1 -1 C -1 -1 2 -1 -1 G -1 -1 -1 2 -1 * -1 -1 -1 -1 2 为

文档评论(0)

1亿VIP精品文档

相关文档