- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于动态规划全局双序列比对优化算法
一种基于动态规划的全局双序列比对优化算法
摘要:序列比对是生物信息处理中非常重要的一类方法,基本的序列比对算法是基于动态规划思想提出的。本文提出了一种基于动态规划思想的全局双序列比对优化算法(Optimized Global Pairwise Sequence Alignment based on the idea of Dynamic Programming) OGPSADP,在保持基本动态规划敏感性的前提下,GOPSA方法计算替换矩阵时只需存储当前相邻两列的元素,同时引用checkpoint技术以减少计算迭代次数,有效降低了时间复杂度和空间复杂度。
关键词:生物信息学;序列全局比对;动态规划;替换矩阵
中图分类号:TP301文献标识码:A文章编号:1009-3044(2007)06-11594-03
1 引言
生物信息学是生物学的一个分支,它采用信息科学、计算机科学、生物数学、比较生物学等学科的观点和方法对生命的现象及其组成分子(核酸、蛋白质等)进行研究,主要研究生命中的本质和规律,包括物质组成、结构功能、生命体的能量和信息的交换传递等。
序列比对是生物学中最基本、最重要的方法,是生物学计算的核心。序列比对又叫序列联配,其意义在于从核酸、氨基酸的层次中分析序列的相似性,推测其结构功能及进化上的联系,是基因识别、分子进化、生命起源研究的基础[1]。最常见的比对是蛋白质序列之间或核酸序列之间的两两比对,通过比较两个序列之间的相似性区域,寻找二者可能的分子进化关系。进一步的比对是将多个蛋白质序列或核酸序列同时进行比较,寻找这些有进化关系的序列之间共同的保守区域、位点和剖面信息,从而探索导致它们产生相同功能的序列模式。
2 序列比对
序列同源(homology)指的是序列来自相同的祖先,意味着这些序列具有相同的进化历史,而序列的相似性(similarity)指的是两序列在某参数条件下的相像,它可以用相同残基的百分比或是其他的方法来表示。序列之间的相似度是可以量化的参数,而序列是否同源需要有进化事实的验证,显著的相似性通常意味着同源。
序列比对是运用某种特定的数学模型或算法,找出两个或多个序列之间的最大匹配碱基或残基数,比对算法的结果在很大程度上反映了序列之间的相似性程度以及它们的生物学特征[2]。序列比对根据同时进行比对的序列数目多少可分为双序列比对(pair-wise sequence alignment)和多序列比对(multiple sequence alinment)。序列比对从比对范围考虑也可分为全局比对(global alignment)和局部比对(local alignment),全局比对考虑序列的全局相似性,局部比对考虑序列片断之间的相似性。如下所示。
全局比对:
LGPSSKQTGKGS-SRIWDN
LN-ITKSAGKGAIMRLGDA
局部比对:
在实际应用中,用全局比对方法企图找出只有局部相似性的两个序列之间的关系显然是徒劳的;而用局部比对得到的局部相似性结果则同样不能说明这两个序列的三维结构或折叠方式是否相同。从这个意义上讲,局部相似性搜索比整体相似性比对更加灵敏,也更具有生物学意义[3]。
3 动态规划思想
动态规划[4]解决序列比对问题的基本思想:使用迭代法计算出两个序列的相似分值,并存入一个得分矩阵中,根据得分矩阵回溯寻找最优的比对序列。
全局比对中的动态规划:
假设存在两条序列As=(a1a2…an)和Bs=(b1b2…bn),如图1所示,将As和Bs分别作为横坐标和纵坐标放置,组成一个路径矩阵,即得分矩阵,矩阵元素(i,j)值为比对的得分值。在得分矩阵中到达位置为(i,j)的某一个元素有三种可能的路径:通过位置i-1,j-1的对角方向,没有空位罚分;通过列j的垂直方向,通过行i的水平方向,空位罚分的值取决于插入空格的个数。
得分矩阵的元素值通过公式(1)进行迭代计算,得分矩阵的元素值的迭代方式如图2所示。
图2 迭代逻辑图
其中Si,j=s(a1a2…an, b1b2…bn,)是到达序列As中第i位字符与序列Bs中第j位字符的比对得分值;S(ai,bi)是根据替换矩阵得到的ai和bi匹配得分;wx和wy是As和Bs序列的i和j位置前长度为x和y的空位罚分,Sij是动态决定序列As和Bs的子序列的最优得分,矩阵的每个位置都具有得分时,序列整体的最优比对得分将是矩阵最后一行一列的位置的得分。要决定两条序列的最优比对,需要用到回溯技术,即沿着产生最高序列比对得分的路径向相反方向移动,记录相应位置的序列残基字母,这样就可以得到最优的序列的比对方式。
您可能关注的文档
最近下载
- 八年级生物(上)第六章 《人体生命活动的调节》单元检测卷含答案解析.docx
- 一种水生萤火虫室内规模化饲养装置.pdf VIP
- D301-1~3 室内管线安装(2004年合订本).docx VIP
- 2025至2030中国电子树脂行业产业运行态势及投资规划深度研究报告.docx
- 三一中型挖掘机SY335BH SIC_产品手册用户使用说明书技术参数图解图示电子版.pdf VIP
- 全科教学模式探讨及实践(安徽医科大学第一附属医院 全科医学科 全科医学教研室 唐海沁).pdf VIP
- 最全(一)公安局辅警招聘考试题库.doc VIP
- 直接引语和间接引语课件详细.ppt VIP
- 西式面点师(初级)课件 项目2 面包制作.pptx
- 发酵设备课程设计——1000m³内循环气升式生物酒精发酵罐设计.doc VIP
文档评论(0)