- 1、本文档共63页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多序列比对讲解
多序列比对 (Multiple Alignments);分析多个序列的一致序列,识别蛋白质家族的序列模式
辅助预测新序列的二级或三级结构,相似的蛋白质序列往往具有相似的结构与功能
PCR 引物设计
用于进化分析,是用系统发育方法构建进化树的初使步骤,寻找同源基因;一个多序列比对例子;多序列比对与进化研究例子;多序列比对方法;多序列比对总体思路;在多序列比对前要考虑的问题;全局序列比对;
序列长度为 n 的双序列比对
n2 比对
比对数目成指数增长
例如:序列长度为n,序列数为N 的多序列 比对数目是nN
对于数目较少且较短的序列来说都不切实际;Sequence 1;分而治之 (Divide and Conquer, DCA)方法(Stoye,et al,1997)
将MSA的空间复杂度减小
DCA在线MSA
http://bioweb.pasteur.fr/seqanal/interfaces/dca-simple.html
;So in effect …;SP(Sum of Pairs)方法;SP 方法例子;
计算所有双序列比对的分数
用这些分数构建进化树
基于进化树计算双序列比对权重
基于进化树构建一个启发式多序列比对(Heuristic Alignment )
计算每一对双序列比对的最大权重ε
计算比对的空间位置以达到最佳比对
完成最佳比对
输出与最大权重ε比较所获得的ε
慢且消耗大量内存
最大可以比对8-9 个长约250的氨基酸残基;?针对基于动态规划算法的MSA程序比对序列数目有限, Feng Doolittle(1987)发明了累进算法
?主要思想:通过双序列比对构建进化关系,并通过这种关系来构建序列比对
? CLUSTAL 和 PILEUP 是目前常用的基于累进算法的比对软件
? CLUSTAL 是免费软件,目前应用非常广泛。
分为基于文本的CLUSTALW和图形用户界面的CLUSTALX
http://www-igbmc.u-strasbg.fr/BioInfo/ClustalX/Top.html
? T-Coffee 是一种新的基于CLUSTAL的程序,
它在比对关系较远的系列上较CLUSTAL更具优势,
但速度较CLUSTAL 要慢
;1 对所有序列做双序列比对,
构建距离矩阵计算相似性分数值;一般的累进比对方法;果仁糖累进方法(Praline progressive strategy);累进算法的一些问题;ClLUSTALW/X简介;CLUSTAL方法;ClustalX;ClustalX;ClustalX;ClustalX;ClustalX;Example;PILEUP;Output of Pileup;Output of Pileup;ClUSTAL和PILEUP存在的问题;针对累进比对方法的不足产生了迭代??法
迭代方法策略
在比对过程中不断重新比对各亚组序列
把亚组序列再排成包括所有序列在内的整体比对
获得最优的总比对分数(由成对比对分数相加而成)
;迭代方法程序;一种由计算机科学家发明的普通机器学习算法
一种很好的解决进化改变问题的方法
原理:通过重排模拟进化过程中空位的插入与重组来尝试多种的MSA方案,以达到越来越高的MSA记分
缺点:序列超过20条时会变的非常慢
与模拟退火算法相近,模拟退火算法是通过其概率途径来调整已有的比对来获得高记分的MSA;局部序列比对;概形分析 (Profile Analysis);概形分析 (Profile Analysis);不同物种HSP70蛋白的profile图;ACD……VWY;A
C
D
.
.
Y;用CLUSTALX进行Profile比对;区块分析;MSA中的统计学方法 (Statistical Methods);最大期望运算法则;EM算法策略;MEME(Multiple EM for Motif Elicitation);MEME结果;吉布斯取样器(Gibbs Sampler);隐马尔可夫模型(HMM);隐马尔可夫模型(HMM);HMM示意图;How to create a HMM;Example: 1. Sequence selection;2.Alignment;模型建立;位置特异性记分矩阵;用PSSM来搜寻一条序列,以找到此序列具有PSSM所代表的序列模体(motif) 的可能位置
用来搜索整个数据库以寻找额外的具有相同模体(motif)的序列
寻找蛋白质家族所共有的序列模式、转录因子结合位点和内含子与外显子交界区共有的序列模式;序列标语(Sequence Logos);MSA编辑;MSA编辑器;CINEMA;MSA编辑器
您可能关注的文档
最近下载
- (高清版)-B-T 4798.2-2021 环境条件分类 环境参数组分类及其严酷程度分级 第2部分:运输和装卸.pdf VIP
- 《插花与花艺设计》课件——项目四 礼仪插花.pptx VIP
- 《通信数据分析与实战》课件——第六章 Kafka 分布式发布订阅消息系统.pptx VIP
- GA∕T 1424-2017 法庭科学合成纤维物证检验 红外光谱法.pdf
- 大数据平台与编程第9章 分布式消息队列Kafka.pptx VIP
- 《学前儿童艺术教育》课程标准.docx VIP
- 卫生专业技术资格考试临床医学检验技术(中级379)基础知识强化训练精练试题解析.docx VIP
- 2025高考英语全国II卷试题分析及备考策略指导课件.pdf VIP
- 销售人员必备的素质.ppt
- 2025年机动车检测站授权签字人试题题库及参考答案(通用版).pptx
文档评论(0)