- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 序列比对;序列比对概念
序列比对用途
常用术语
序列比对的类型
序列比对的策略
打分系统---打分矩阵
比对算法
-全局比对Needleman-Wunsch算法
-局部比对Smith-Waterman算法
序列比对搜索程序; 序列比对概念;序列比对用途;48条染色体〔24对)
黑猩猩细胞色素C的氨基酸顺序与人类的相同;常用术语;序列比较;Dot Matrix;The amino acid sequences of the phage λcI (horizontal sequence) and phage P22 c2 (vertical
sequence) repressors. The window size and stringency are both 1.;序列比对的类型;Global vs. Local;序列1(待测序列): AGGVLIIQVG
||||||
序列2(目标序列): AGGVLIQVG;序列1(待测序列): ATCTG
序列2(目标序列): ATCAG;序列比对目的和实现方法;打分系统---打分矩阵;遗传密码子矩阵 (氨基酸)
所有的氨基酸突变都产生于核苷酸的变化,故氨基酸 替换的分值应取决于由一个密码子转变为另一密码子所 必需的突变的数量。一种遗传密码子打分矩阵根据导致密码子改变所需改变核苷酸的数量来定义两个 氨基酸之间的距离,比如PAM矩阵
不同氨基酸之间的替换率是不一样的,原因有密码子突变,氨基酸间理化性质的相似性等。另一种遗传密码子打分矩阵则是直接基于实际氨基酸之间的替换率,比如Blosum矩阵
矩阵元素通常为比对中的一对字符(氨基酸或碱基)随机发生的概率(每个氨基酸出现的独立概率)与其实际出现的概率之比;Dayhoff的PAM矩阵;250PAM突变概率矩阵(Dayhoff等,1979) ;BLOSUM矩阵;BLOSUM62 (lower part) ;PAM矩阵和BLOSUM矩阵的比较;打分系统---空位罚分;比对方法;全局比对---局部比对;全局比对;Needleman-Wunsch算法;实现算法;例:;步骤1: 初始化打分矩阵:
;打分: Match +2分
mis-match -3分
Gap (insertion deletion) -1分;局部比对工具;Needleman-Wunsch算法的改造;其它基于DP的实现方法;结构-遗传矩阵;V
;?
;?
;?
;序列比对搜索程序;在数据库中查询新序列;启发式算法特征;操作和评估;FASTA;FASTA;FASTA的快速来源于其在序列库中进行的快速初检,找出与待检序列高度相似的序列,但这一快速检索局限于待检序列和序列库序列之间较短的完全相同序列区段上
改进的FSATA程序可对结果进行统计显著性评估;数据库相似性搜索程序FASTA;BLAST;BLAST;数据库相似性搜索程序BLAST;BLAST的一项重要特性就是所报告的匹配序列的统计学显著性评分。这一统计学显著性评分是用Karlin-Altschul算法决定的,所算出的Poisson概率表明所得到的序列相似性随机出现的可能性。
;表示仅仅因为随机性造成获得联配结果的可能次数。这一数值越接近零,发生这一事件的可能性越小。从搜索的角度看,E值越小,联配结果越显著。
;BLAST2.0版本已有序列过滤器功能。过滤器将锁定诸如组成低复杂(low compositional complexity)序列区(如Alu序列),用一系列N(NNNNNN)替代这些序列。N代表任意碱基(IUB-code)。只有未知待检序列被过滤替代,而数据库的序列将不被过滤。
过滤对绝大多数序列都是有益的,“Filter”项的缺省选项为ON。
;总结FASTA和BLAST;FASTA和BLAST系列程序;因为BLAST和FASTA采用不同的算法,可同时用这两种搜索引擎重新检索某一特定序列,如果用其中一种找不到显著相似序列,不妨试一试另一程序。
如果BLAST和FASTA均找不到显著匹配的序列,还可以选择第3条比较费时的搜索策略。一些网站允许用户使用基于Smith-Waterman算法的搜索程序,如BLITZ。
BLITZ(www.ebi.ac.uk/searchs/blitz.html)被设计在大型并行计算机上运行,因此使检索更灵敏。虽然运行这样的程序比较费时,但它们有时会发现一些被BLAST和FASTA错过的勉强达到显著的联配。
;搜索数据库的主要程序;Thank you!;应用举例;用一组BLAST程序联配可以快速进行核酸和蛋白质序列库的相似性
您可能关注的文档
最近下载
- 羊水栓塞护理措施.pptx VIP
- 星球版八年级上册地理第四章《第一节 因地制宜发展农业》教案.docx VIP
- 2025年粤东西北教师全员轮训心得体会2篇.doc VIP
- TCRHA-成人床旁心电监测护理规程.pdf VIP
- 中联W6015-8A塔吊说明书操作手册.pdf VIP
- 过滤材料和部件市场前景预测与技术创新策略研究报告.pdf
- 新生儿甲状腺功能降低.pptx
- 8.27-安徽A10联盟2025届高三8月底开学摸底考试题及答案1号卷·A10联盟2025届高三上学期8月底开学摸底考物理答案.pdf VIP
- 华为HCIE-CloudServiceSolutionsArchitect云服务练习试题.doc
- 8.27-安徽A10联盟2025届高三8月底开学摸底考试题及答案A10联盟2025届高三上学期8月底开学摸底考英语答案 1.docx VIP
文档评论(0)