基因比对的基本方法.pptVIP

  • 20
  • 0
  • 约1.36千字
  • 约 16页
  • 2017-08-21 发布于重庆
  • 举报
基因比对的基本方法.ppt

序列比对的基本方法(二) 内 容 1.基本方法概述 2.FASTA简介 3.BLAST介绍 概 述 序列比对(alignment):为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。,将两个或多个序列排列在一起,标明其相似之处。 序列相似性比较:就是将待研究序列与DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找出与此序列相似的已知序列是什么。完成这一工作只需要使用两两序列比较算法。 常用的程序包括BLAST,FASTA等; 序列同源性分析:是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小。这是理论分析方法中最关键的一步。完成这一工作必须使用多序列比较算法。 常用的程序有CLUSTAL等。 FASTA简介 Fasta算法是由Lipman和Pearson于1985年发表的,基本思路是识别与代查序列相匹配的很短的序列片段,称为k-tuple。 以下是EBI提供的fasta的服务:http://www.ebi.ac.uk/fasta33/ BLAST BLAST是一个NCBI开发的基因序列相似性数据库搜索程序,还可作为鉴别基因和遗传特点的手段。 BLSTA是Basic Local Alignment Search Tool‘局部相似性基本查询工具’的缩写 Compare a query sequence to all the sequences in a specified database BLAST的资源 网络版本:在线的blast服务是我们最经常用到的blast服务。 单机版本:可以通过NCBI的ftp站点获得,有适合不同平台的版本包括linux,dos等。获得程序的同时必须获取相应的数据库才能在本地进行blast分析。 网络版本 网络版 /Blast/ 优点:服务使用方便,容易操作,数据库同步更新等优点; 缺点:不利于操作大批量的数据库,同时也不能自己定义搜索的数据库。 单机版本 单机版:/blast/executables/ 优点:是可以处理大批的数据,可以自己定义数据库; 缺点:需要耗费本地机的大量资源,此外操作也没有网络版直观,方便,需要一定的计算机操作水平。 BLAST分类 Blast是一个序列相似性搜索的数据包,其中包含了很多个独立的程序,这些程序是根据查询的对象和数据库的不同来定义的。 BLAST分类 程序名 查询序列 数据库 搜索方法 Blastn 核酸 核酸 核酸序列搜索逐一核酸数据库中的序列 Blastp 蛋白质 蛋白质 蛋白质序列搜索逐一蛋白质数据库中的序列 Blastx 核酸 蛋白质 核酸序列6框翻译成蛋白质序列后和蛋白质数据库中的序列逐一搜索 Tblastn 蛋白质 核酸 蛋白质序列和核酸数据库中的核酸序列6框翻译后的蛋白质逐一比对 Tblastx 核酸 核酸 核酸序列6框翻译成蛋白质序列,再和核酸数据库中的核酸序列6框翻译成的蛋白质序列逐一进行比对,执行相当久 THANK YOU!

文档评论(0)

1亿VIP精品文档

相关文档