3.9多序列比对介绍-01-用途和算法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《生物信息学》第三章:序列比较(第三部分) 多序列比对介绍:用途和算法 学习了双序列比对之后,我们来看多序列比对。多序列比对的定义很简单,两条以上的 生物序列进行的全局比对就是多序列比对(图 1)。为了看清楚每一列的保守情况和理化性 质,通常会给多序列比对根据不同的原则赋予丰富的色彩。 图 1. 多序列比对 在开始讲如何做多序列比对之前,我们需要先看看多序列比对的主要用途,也就是我们 为什么要做多序列比对。1)我们可以通过多序列比对确定某一个未知序列是否属于某一个 家族。2)可以用多序列比对构建系统发生树,查看物种间或者序列间的进化关系。事实上, 做多序列比对是构建系统发生树的必要步骤之一。3)模式识别。一些特别保守的序列片段 往往对应着重要的功能区。通过多序列比对,可以找到这些保守片段,并由此推测出潜在功 能区。4)可以把已知的有特殊功能的序列片段通过多序列比对做出匹配模型。然后根据这 个模型推测未知的序列片段是否也具有这个功能。除此之外,多序列比对在生物信息学分析 的很多方面都有应用,比如用来预测蛋白质的二级结构和三级结构,预测 RNA 的二级结构 等等。由此,我们可以看出,多序列比对的应用是非常广泛的。 接下来我们看一下多序列比对的算法。两条序列的比对需要构建一个二维表格,然后从 右下角到左上角找出一条最优路线。如果是做 3 条序列的比对,应该做一个三维立方体,从 (0,0,0)这个位置到 (n,n,n)这个位置找到最优的贯穿路径。以此类推,如果是做 n 条序 列的比对,就要创建一个 n 维空间。这个 n 维空间实在是难以想象,但是有一点是明确的, 就是到了 n 维我们已经没有办法再像二维那样精确的计算出比对结果了。由于计算量过于巨 大,所以目前所有的多序列比对工具都是不完美的。它们都使用一种近似的算法。目的就是 为了缩短计算时间,但也因此牺牲了一定的准确度。好在多序列比对并不像双序列比对对准 确度要求极高。通常,我们是要从多序列比对中看到一个趋势,一个大体的位置,所以牺牲 掉的这点儿准确度影响不大。我们这门课不讲具体的多序列比对算法,直接使用程序猿同志 已经开发好的在线多序列比对工具。

文档评论(0)

恬淡虚无 + 关注
实名认证
内容提供者

学高为师,身正为范.师者,传道授业解惑也。做一个有理想,有道德,有思想,有文化,有信念的人。 学无止境:活到老,学到老!有缘学习更多关注桃报:奉献教育,点店铺。

1亿VIP精品文档

相关文档