生物序列联配中的算法.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

生物序列联配中的算法张法

提纲背景知识序列相似性的比较两条序列的联配问题多序列的联配问题一些启发式的算法生物序列联配中的并行算法

DNA(1)脱氧核糖核酸DNA的分子组成核甘(nucleotides)磷酸盐(phosphate)糖(sugar)一种碱基腺嘌呤(Adenine)鸟嘌呤(Guanine)胞嘧啶(Cytosine)胸腺嘧啶(Thymine)

DNA(2)01A(腺嘌呤)—T(胸腺嘧啶)C(鸟嘌呤)—G(胞嘧啶)碱基的配对原则02过氢键联结成一个碱基对。一个嘌呤基与一个嘧啶基通035→3DNA分子的方向性

DNA(3)DNA的双螺旋结构碱基对之间的互补能力

DNA(4)DNA的复制在DNA解旋酶的作用下两条链分离开,分别作为一个模板,在聚合酶的作用下合成一条新链。

231RNA(核糖核酸):单链结构、尿嘧啶U代替胸腺嘧啶T、位于细胞核和细胞质中。转录:DNA链→RNA链信使RNA(mRNA),启动子。翻译:mRNA上携带遗传信息在核糖体中合成蛋白质的过程。RNA、转录和翻译

进化过程中由于不正确的复制,使DNA内容发生局部的改变。变异的种类主要有以下三种:替代(substitution)插入或删除(insertionordeletion)indel重排(rearrangement)变异

蛋白质由氨基酸依次链接形成在生物体中总共有20种氨基酸。蛋白有十分复杂的三维结构。其三维机构决定了蛋白质的功能。

基因01什么是基因?DNA上具有特定功能的一个片断,负责一种特定性状的表达。一般来讲,一个基因只编码一个蛋白质。02

基因组任何一条染色体上都带有许多基因,一条高等生物的染色体上可能带有成千上万个基因,一个细胞中的全部基因序列及其间隔序列统称为genomes(基因组)。

基因DNA上的基因

基因编码是一个逻辑的映射,表明存储在DNA和mRNA中的基因信息决定什么样的蛋白质序列。碱基组成的三元组的排列共有43=64种,而氨基酸共有20种类型,所以不同的密码子可能表示同一种氨基酸。每个碱基三元组称为一个密码子(codon)基因的编码

01.序列排列问题02.基因组的重排问题03.蛋白质结构和功能的预测04.基因(外显子、内含子)查找问题05.序列装配(SequenceAssembly)问题带来的问题

生物序列相似性的比较

动机在生物学的研究中,将未知序列同已知序列进行比较分析已经成为一种强有力的研究手段,生物学领域中绝大部分的问题在计算机科学领域中主要体现为序列或字符串的问题。

01如果两个序列具有足够的相似性,则认为两者具有同源性。02序列相似性的比较(两条序列的联配03序列的分04序列的排05多序列的联序列联配问题的分类

01全局联配(GlobalAlignment)03空位处罚(GapPenalty)02局部联配(LocalAlignment)两条序列联配问题的分类

?(x,x)=2,?(x,y)=?(x,-)=?(-,y)=-1定义1:两个任意的字符x和y,?(x,y)表示表x和y比较时的分值。01|S’|=|T’|;将S’和T’中的空字符除去后所得到的序列分别为S和T;联配A的分值Score为:定义2:S=s1…sn和T=t1…tm,其全局联配A可以用序列S’和T’来表示,其中:02全局联配(1)-定义

全局联配(2)-原始算法输入:序列S和T,其中|S|=|T|=n输出:S和T的最优联配fori=0tondofor(S的所有的子序列A,其中|A|=i)dofor(T的所有的子序列B,其中|B|=i)do……

动态规划DP(DynamicProgramming)Smith-Waterman算法计算出两个序列的相似分值,存于一个矩阵中。(相似度矩阵、DP矩阵)根据此矩阵,按照动态规划的方法寻找最优的联配序列。全局联配(3)

01前提条件02递归关系全局联配(4)

1在得到相似度矩阵后,通过动态规划回溯(Traceback)的方法可获得序列的最优联配序列。2例:S=“acgctg”和T=“catgt”3?(x,x)=2,?(x,y)=?(x,-)=?(-,y)=-1全局联配(5)

ji01c2a3t4g5t00-1-2-3-4-51a-1-110-1-22c-2100-1-23g-300-1214c-4-1-1-1115t-5-2-21036g-6-3-3032

文档评论(0)

135****2083 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档