生物信息学作业102.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物信息学作业102.ppt生物信息学作业102.ppt生物信息学作业102.ppt

局部相似性和整体相似性 序列比对的基本思想,是找出检测序列和目标序列的相似性。比对过程中需要在检测序列或目标序列中引入空位,以表示插入或删除(图2)。 图2 序列比对,图中“-”表示插入和删除,用字符表示相同的残基,“+”表示相似残基 序列比对大体可以分为两类,一类从全长序列出发,考虑序列的整体相似性(global alignment),即整体比对;第二类考虑序列部分区域的相似性,即局部比对(local alignment)。 局部相似性比对的生物学基础是蛋白质功能位点往往是由较短的序列片段组成的,这些部位的序列具有相当大的保守性,尽管在序列的其它部位可能有插入、删除或突变。此时,局部相似性比对往往比整体比对具有更高的灵敏度,其结果更具生物学意义。 区分这两类相似性和这两种不同的比对方法,对于正确选择比对方法是十分重要的。 在实际应用中,用整体比对方法企图找出只有局部相似性的两个序列之间的关系,显然是徒劳的;而用局部比对得到的结果也不能说明这两个序列的三维结构或折叠方式一定相同。 BLAST和FastA等常用的数据库搜索程序均采用局部相似性比对的方法,具有较快的运行速度,而基于整体相似性比对的数据库搜索程序则需要超级计算机或专用计算机才能实现。 Blast简介 BLAST 是由美国国立生物技术信息中心(NCBI)开发的一个基于序列相似性的数据库搜索程序。 BLAST是“基本局部相似性比对搜索工具”(Basic Local Alignment Search Tool)的 缩写。 国际著名生物信息中心都提供基于Web的BLAST服务器。BLAST程序之所以使用广泛,主要因为其运行速度比FastA等其它数据库搜索程序快,而改进后的BLAST程序允许空位的插入。 Blast 是一个序列相似性搜索的程序包,其中包含了很多个独立的程序,这些程序是根据查询的对象和数据库的不同来定义的。比如说查询的序列为核酸,查询数据库亦为核酸序列数据库,那么就应该选择blastn程序。 下表列出了主要的blast程序。 Blast简介 主要的blast程序 程序名 查询序列 数据库 搜索方法 Blastn 核酸 核酸 核酸序列搜索逐一核酸数据库中的序列 Blastp 蛋白质 蛋白质 蛋白质序列搜索逐一蛋白质数据库中的序列 Blastx 核酸 蛋白质 将核酸序列按6条链翻译成蛋白质序列后与蛋白质数据库中的序列逐一搜索。 Tblastn 蛋白质 核酸 用检测序列蛋白质搜索由核酸序列数据库按6条链翻译成的蛋白质序列数据库 TBlastx 核酸 核酸 将核酸序列按6条链翻译成蛋白质序列后搜索由核酸序列数据库按6条链翻译成的蛋白质序列数据库 Blast相关的问题 怎么获得blast服务,怎么使用的问题? 为什么使用blast,可以获得什么样的信息? 其他问题:实际使用时选择哪种方式(网络,本地化),参数的选择,结果的解释… Blast资源 1.NCBI主站点: /BLAST/(网络版) /blast/ (单机版) Blast结果给出的信息 Blast结果会列出跟查询序列相似性比较高,符合限定要求的序列结果,根据这些结果可以获取以下一些信息。 1.查询序列可能具有某种功能 2.查询序列可能是来源于某个物种 3.查询序列可能是某种功能基因的同源基因 … 这些信息都可以应用到后续分析中。 两种版本的Blast比较(一) 网络版本 包括NCBI在内的很多网站都提供了在线的blast服务,这也是我们最经常用到的blast服务。网络版本的blast服务就有方便,容易操作,数据库同步更新等优点。但是缺点是不利于操作大批量的数据。 单机版 单机版的blast可以通过NCBI的ftp站点获得,有适合不同平台的版本(包括Windows等)。获得程序的同时必须获取相应的数据库才能在本地进行blast分析。单机版的优点是可以处理大批的数据,但是需要耗费本地机的大量资源,此外操作也没有网络版直观、方便,需要一定的计算机操作水平。 两种版本的Blast比较(二) Blast程序评价序列相似性的两个数据 Score:使用打分矩阵对匹配的片段进行打分,这是对各对氨基酸残基(或碱基)打分求和的结果,一般来说,匹配片段越长、 相似性越高则Score值越大。 E value:在相同长度的情况下,两个氨基酸残基(或碱基)随机排列的序列进行打分,得到上述Score值的概率的大小。E值越小表示随机情况下得到该Score值的可能性越低。 NCBI提供的Blast服务 登陆ncbi的blast主页 核酸序列 蛋白序列 翻译序列 底下有其他一些针对特殊数据库的和查看以往的比对结果等 Blast任

文档评论(0)

shaoye348 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档