- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物信息学第二序列比对第1页/共61页第2页/共61页第一节 引 言 Section 1 Introduction 第3页/共61页、同源、相似与距离(一) 同源两个序列享有一个共同的进化上的祖先,则这两个序列是同源的。对于两个序列,他们或者同源或者不同源,不能说他们70%或80%同源。第4页/共61页同源可分为垂直同源(ortholog)和水平同源(paralog)垂直同源与水平同源第5页/共61页(二)相似性与距离相似性、距离:是两个定量描述多个序列相似度的度量。相似性:被比对序列之间的相似程度。距离:被比对序列间的差异程度。相似性既可用于全局比对也可用于局部比对,而距离一般仅用于全局比对,因为它反映了把一个序列转换成另一个序列所需字符替换的耗费。第6页/共61页二、相似与距离的定量描述相似性可定量地定义为两个序列的函数,即它可有多个值,值的大小取决于两个序列对应位置上相同字符的个数,值越大则表示两个序列越相似。编辑距离(edit distance)也可定量地定义为两个序列的函数,其值取决于两个序列对应位置上差异字符的个数,值越小则表示两个序列越相似。第7页/共61页对于一个比对,不论使用什么计分函数进行计分,相似性被定义为总等值于最大的计分:对于k个序列,如果用一个函数cost()对每一列的所有替换操作进行计分,则多个序列之间的距离等值于最小的计分:第8页/共61页对相似性的计分第9页/共61页编辑距离(edit distance):一般用海明距离表示。第10页/共61页三、算法实现的比对用计算机科学的术语来说,比对两个序列就是找出两个序列的最长公共子序列(longest common subsequence,LCS),它反映了两个序列的最高相似度。第11页/共61页动态规划法示意(A)使用动态规划法寻找两个序列的最长公共部分;(B)动态规划表的填写。第12页/共61页四、序列比对的作用获得共性序列序列测序突变分析种系分析保守区段分析基因和蛋白质功能分析第13页/共61页第二节 比对算法概要Section 2 Alignment Algorithms第14页/共61页一、替换计分矩阵(一)通过点矩阵对序列比较进行计分A.两条序列完全相同第15页/共61页B.两条序列有一个共同的子序列第16页/共61页C.两条序列反向匹配第17页/共61页D.两条序列存在不连续的两条子序列第18页/共61页(二)DNA序列比对的替换计分矩阵等价矩阵(unitary matrix)转换-颠换矩阵(transition-transversion matrix)BLAST矩阵第19页/共61页核苷酸转换矩阵第20页/共61页(三)蛋白质序列比对的替换计分矩阵等价矩阵遗传密码矩阵(GCM)疏水性矩阵(hydrophobic matrix )PAM矩阵BLOSUM矩阵第21页/共61页PAM矩阵是从蛋白质序列的全局比对结果推导出来的,而BLOSUM 矩阵则是从蛋白质序列块(短序列)比对推导出来的。PAM/BLOSUM矩阵编号与序列亲缘关系的比较第22页/共61页二、双序列全局比对动态规划算法的思想⑴ a, b是使用某一字符集∑的序列(DNA 或蛋白质序列);⑵ m = a的长度;⑶ n = b的长度;⑷ S(i,j) 是按照某替换计分矩阵得到的前缀a[1...i]与b[1...j]最大相似性得分;第23页/共61页⑸ w(c,d)是字符c和d按照替换计分矩阵计算的得分。可按照规则建立得分矩阵:S(i,0) = 0, 0 ≤ i ≤ mS(0,j) = 0, 0 ≤ j ≤ n S(i-1,j-1)+ w(ai,bj) 匹配或错配S(i,j)=max S(i-1,j)+ w(ai,-) 插入 S(i,j-1) 缺失不罚分第24页/共61页例如,对于序列a=ACACACTA,序列b=AGCACACA,计分规则w(匹配)=+2;w(a,-)=w(-,b)=w(失配)=-1第25页/共61页得分矩阵第26页/共61页三、双序列局部比对处理子序列与完整序列(或短序列与长序列)比对的一般过程是:设短序列a和长序列b,它们的长度分别为La和Lb,比对是在b序列中寻找La长度的a序列的过程。第27页/共61页四、多序列全局比对多序列比对主要涉及四个要素:①选择一组能进行比对的序列(要求是同源序列);②选择一个实现比对与计分的算法与软件;③确定软件的参数;④合理地解释比对的结果;与双序列比对一样,多序列比对也有全局比对和局部比对。第28页/共61页(一)动态规划法进行多序列比对计算三序列比对(A)计算三个序列间的一个比对单元(i,j,k)依赖于其7个前导项;(B)计算u=ATGTTAT,v=ATCGTAC,w=ATGC三序列比对的三维得分
您可能关注的文档
- 精益物流配送管理.pptx
- 培育与践行社会主义核心价值观宣讲.pptx
- 德鲁克管理精髓.pptx
- 离体蛙类心脏灌注及药物的影响.pptx
- 固体矿产勘查概述.pptx
- 燃气燃烧器课件.pptx
- 美国概况英语教学.pptx
- 二月二龙抬头.pptx
- 透析患者抗高血压药物的优化选择.pptx
- 科学神经调节课时浙教八上.pptx
- 《2025年公共卫生应急报告:AI疫情预测与资源调配模型》.docx
- 《再生金属行业2025年政策环境循环经济发展策略研究》.docx
- 2025年开源生态AI大模型技术创新与产业协同趋势.docx
- 《2025年智能汽车人机交互创新研究》.docx
- 2025年专利申请增长趋势下的知识产权保护机制创新分析报告.docx
- 《2025年数字藏品元宇宙技术发展趋势分析报告》.docx
- 2025年折叠屏技术迭代中AI功能集成市场反应量化分析报告.docx
- 《2025年教育培训视频化教学与会员学习服务》.docx
- 《2025年工业软件行业CAD国产化应用场景分析报告》.docx
- 《2025年生物制药行业趋势:单抗技术迭代与产业链自主可控规划》.docx
原创力文档


文档评论(0)