- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多序列比对研究分析生生物信息学课件06.ppt
多序列比对 (Multiple Alignments);寻找蛋白质家族,识别保守区与可变区
功能预测:相似的蛋白质序列往往具有相似的结构与功能
结构预测:辅助预测新序列的二级或三级结构
可以直观地看到基因的哪些区域对突变敏感
系统发育分析
;一个多序列比对例子;多序列比对与进化研究例子;多序列比对方法;多序列比对总体思路;在多序列比对前要考虑的问题;Sequence 1;分而治之 (Divide and Conquer, DCA)方法(Stoye,et al,1997)
将MSA的空间复杂度减小
DCA在线MSA
http://bioweb.pasteur.fr/seqanal/interfaces/dca-simple.html
;So in effect …;SP(Sum of Pairs)方法;SP 方法例子;
计算所有双序列比对的分数
用这些分数构建进化树
基于进化树计算双序列比对权重
基于进化树构建一个启发式多序列比对(Heuristic Alignment )
计算每一对双序列比对的最大权重ε
计算比对的空间位置以达到最佳比对
完成最佳比对
输出与最大权重ε比较所获得的ε
慢且消耗大量内存
最大可以比对8-9 个长约250的氨基酸残基;?针对基于动态规划算法的MSA程序比对序列数目有限, Feng Doolittle(1987)发明了累进算法
?主要思想:通过双序列比对构建进化关系,并通过这种关系来构建序列比对
? CLUSTAL 和 PILEUP 是目前常用的基于累进算法的比对软件
? CLUSTAL 是免费软件,目前应用非常广泛。
分为基于文本的CLUSTALW和图形用户界面的CLUSTALX
http://www-igbmc.u-strasbg.fr/BioInfo/ClustalX/Top.html
? T-Coffee 是一种新的基于CLUSTAL的程序,
它在比对关系较远的序列时较CLUSTAL更具优势,
但速度较CLUSTAL 要慢
;1 对所有序列做双序列比对,
构建距离矩阵计算相似性分数值;一般的累进比对方法;果仁糖累进方法(Praline progressive strategy);累进算法的一些问题;ClLUSTALW/X简介;CLUSTAL方法;ClustalX;ClustalX;ClustalX;ClustalX;ClustalX;Example;PILEUP;Output of Pileup;Output of Pileup;ClUSTAL和PILEUP存在的问题;针对累进比对方法的不足产生了迭代方法
迭代方法策略
在比对过程中不断重新比对各亚组序列
把亚组序列再排成包括所有序列在内的整体比对
获得最优的总比对分数(由成对比对分数相加而成)
;迭代方法程序;一种由计算机科学家发明的普通机器学习算法
一种很好的解决进化改变问题的方法
原理:通过重排模拟进化过程中空位的插入与重组来尝试多种的MSA方案,以达到越来越高的MSA记分
缺点:序列超过20条时会变的非常慢
与模拟退火算法相近,模拟退火算法是通过其概率途径来调整已有的比对来获得高记分的MSA;局部序列比对;概形分析 (Profile Analysis);概形分析 (Profile Analysis);不同物种HSP70蛋白的profile图;ACD……VWY;A
C
D
.
.
Y;用CLUSTALX进行Profile比对;区块分析;MSA中的统计学方法 (Statistical Methods);最大期望运算法则;EM算法策略;MEME(Multiple EM for Motif Elicitation);MEME结果;吉布斯取样器(Gibbs Sampler);隐马尔可夫模型(HMM);隐马尔可夫模型(HMM);HMM示意图;How to create a HMM;Example: 1. Sequence selection;2.Alignment;模型建立;位置特异性记分矩阵;用PSSM来搜寻一条序列,以找到此序列具有PSSM所代表的序列模体(motif) 的可能位置
用来搜索整个数据库以寻找额外的具有相同模体(motif)的序列
寻找蛋白质家族所共有的序列模式、转录因子结合位点和内含子与外显子交界区共有的序列模式;序列标语(Sequence Logos);MSA编辑;MSA编辑器;CINEMA;MSA编辑器
您可能关注的文档
最近下载
- 土地资源调查课件.pptx VIP
- 2025教学主任及教秘专项培训班考核试卷含答案.docx
- QC∕T 948-2013 汽车顶部装载装置.pdf VIP
- 八上名著《红岩》:故事梗概+知识点+考点大集合.doc VIP
- 《劳动经济学讲义》课件.ppt VIP
- ISO各体系认证审核前准备资料清单.doc VIP
- 巧虎目录清单.doc VIP
- 销售管理专业《销售案例研究 ( 实践 ) 》课程调研报告样本.pdf VIP
- 2025年新精通版(三年级起)英语三年级上册课件 Unit 2 Lesson 3 .pptx VIP
- 场效应MOS管AK4435参数-9.1A-30V封装SOP-8.pdf VIP
文档评论(0)