第四章双序列比对.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

BLASTBLAST包含五个程序和若干个相应的数据库第29页,共58页,星期日,2025年,2月5日P值:又称为概率值,判断比对的置信度,p值接近于0表明两序列匹配不大可能是由随机因素造成的,p值越小表明置信度越高。ExpectedFrequency(E)value–numberofhitsonecanexpecttoseebychance(noise)whensearchingadatabaseofaparticularsize.Evalueof1–onematchwithasimilarscorebychance.Evalueof0–nomatchesexpectedbychanceStatisticalSignificanceofBlast第30页,共58页,星期日,2025年,2月5日多序列比对多序列比对就是把两条以上可能有系统进化关系的序列进行比对的方法。意义在于描述一组序列之间的相似性关系,以便对一个基因家族的特征有一个基本的了解。构建多序列比对模型的方法有2种:基于序列信息和基于结构信息。从不同的角度反映了序列中所包含的生物学信息。第31页,共58页,星期日,2025年,2月5日12345678910ⅠⅡⅢⅣⅤYYFFYyDDEDEdGGG-GGGGGGGGA-IIAA/IV-LLVV/L--VVVVEEEQQeAAAAAALLLVLl多序列比对调和序列:获得调和序列的原则:若每列中只有一种残基,则用该残基地大写字母表示;若该列中含有不同残基,则用大多数残基对应的小写字母表示;若该列中出现相同数目的不同残基,则用这些字母对应的大写字母表示。第32页,共58页,星期日,2025年,2月5日算法的复杂性同步法:把给定的所有序列同时进行比对,而不是两两比对或分组进行比对。对计算机系统的要求较高,通常只能进行少量较短序列的比对。步进法:先对所有的序列进行两两比对并计算它们的相似性分值,然后根据相似性分值分成若干组,并在每组之间进行比对,计算相似性分值,再根据分值进行分组继续比对,直到得到最后结果。基于步进法的最常用的多序列比对的程序是Clustal。ClustalW是基于UNIX系统,ClustalX是基于WINDOWS系统。Clustal为免费软件。可从网上下载。生物软件网:/第33页,共58页,星期日,2025年,2月5日CLUSTALW是一种渐进的比对方法,先将多个序列两两比对构建距离矩阵,反应序列之间两两关系;然后从最紧密的两条序列开始,逐步引入邻近的序列并不断重新构建比对,直到所有序列都被加入为止。CLUSTALW的程序可以自由使用,在NCBI的FTP服务器上可以找到下载的软件包。CLUSTALW对输入序列的格式比较灵活,输出格式也可以选择。CLUSTALW网址:http://www.ebi.ac.uk/clustalw下载网址:ftp://ftp.ebi.ac.uk/pub/software第34页,共58页,星期日,2025年,2月5日HFDfingerprint多序列比对结果第35页,共58页,星期日,2025年,2月5日第36页,共58页,星期日,2025年,2月5日第37页,共58页,星期日,2025年,2月5日多序列比对数据库二次数据库:Pfam、PRINTS数据库等。基于多序列比对的数据库搜索程序正在不断地开发。其中位点特异性BLAST(Position-SpecificIteratedBLAST,PSI-BLAST)PSI-BLAST将双序列比对和多序列比对结合在一起的数据库,它运行速度较快,但却有迭代算法本身固有的缺陷,有时会得到错误结果。第38页,共58页,星期日,2025年,2月5日核酸序列分析第39页,共58页,星期日,2025年,2月5日核酸序列的预测方法针对核酸序列的预测就是在核酸序列中寻找基因,找出基因的位置和功能位点的位置,以及标记已知的序列模式等过程。一般而言,在重复片段频繁出现的区域里,基因编码区和调控区不太可能出现;如果某段DNA片段的假想产物与某个已知的蛋白质或其他基因的产物具有较高序列相似性的话,那么这个DNA片段就非常可能属于外显子片段;在一段DNA序列上出现统计上的规律性,即所谓的“密码子偏好性”,也是说明这段DNA是蛋白质编码区的有力证据;其他的证据包括与“模板”序列的模式相匹配、简单序列模式如TATABox等相匹配等

文档评论(0)

xiaoshun2024 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档