生物序列的同源性搜索blast简介及其应用.pptVIP

生物序列的同源性搜索blast简介及其应用.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 4. 对最有可能的匹配序列进一步评分:以增强段init1所在的对角线为中心,划分出一个较狭窄的对角线带,利用S-W算法,来获得分值最高的局部比对,记作opt。 FASTA算法(四) * 决定采用initn或opt的分值,前者敏感度低但速度快。FASTA对每一个检索到的比对都提供一个统计学显著性的评估,以判断该比对的意义。 FASTA算法(五) * * 注意… FASTA对DNA序列搜索的结果要比对蛋白质序列搜索的结果更敏感。它对数据库的每一次搜索都只有一个最佳的比对,一些有意义的比对可能被错过。 * 两个保守区域的信息 返回 * Dot matrix 分析 * 用Dot matrix分析基因中的重复序列 * 使用Dotter在斑马鱼序列的contig中定位ddah基因的位置 * A dot-matrix program with dynamic threshold control suited for genomic DNA and protein sequence analysis Erik L.L. Sonnhammer and Richard Durbin Gene 167(2):GC1-10 (1995) http://www.cgr.ki.se/cgr/groups/sonnhammer/Dotter.html * * 分析过程(六) 图形结果 * 分析过程(七) 匹配序列列表 * 分析过程(八) 具体匹配情况 * 为什么使用单机版的Blast? 1.特殊的数据库要求。 2.涉及序列的隐私与价值。 3.批量处理 4.其他原因?? 单机版的Blast使用(一) * 单机版Blast的基本操作过程 1.下载单机版的Blast程序 /blast/executables/ 目录下,下载对应的操作系统版本。 2.解压程序包(blast-2.28-ia32-linux.tar.gz) 命令是: $ tar zxvf blast-2.28-ia32-linux.tar.gz 单机版的Blast使用(二) * 下载正确的Blast程序包 blast:在本地运行的blast程序包 wwwblast:在本地服务器建立blast服务的网站 netblast:blast的客户端程序,直接链接至NCBI的BLAST服务器,使用BLAST服务,不需浏览器。 * 下载正确的Blast程序包 Blast程序包的名字上还包括了该程序包运行的硬件和操作系统环境: 硬件环境(CPU) 操作系统 sparc powerPC ia32 ia64 amd64 mips alpha linux macox solaris irix aix freebsd win32 hpux * 3.获取Blast数据库 a.直接从ncbi下载 /blast/db/ b.用Blast程序包提供的formatdb工具自己格 式化序列数据成数据库。 假设有一序列数据(sequence.fa,多序列,fasta格式),欲自己做成Blast数据库,典型的命令如下: 单机版的Blast使用(三) * 核酸序列: $ ./formatdb –i sequence.fa –p F –o T/F –n db_name 蛋白序列: $ ./formatdb –i sequence.fa –p T –o T/F –n db_name 单机版的Blast使用(四) * 4.执行Blast比对 获得了单机版的Blast程序,解压开以后,如果有了相应的数据库(db),那么就可以开始执行Blast分析了。 单机版的Blast程序包,把基本的blast分析,包括blastn,blastp,blastx等都整合到了blastall一个程序里面。 单机版的Blast使用(五) * 以下是一个典型的blastn分析命令: (待分析序列seq.fa,数据库nt_db) $./blastall –p blastn –i seq.fa -d nt_db –w 7 –e 10 –o 程序名 输入 数据库 窗口 e值 输出 seq.blastn.out 该命令的意思是,对seq.fa文件中的核酸序列对nt_db数据库执行blastn搜索,窗口大小是7,e值限制是10,输出的结果保存到文件seq.blastn.out 中。 单机版的Blast使用(六) * 5.Blastall的常用参数 -p 程序名应该是blastn,blastp,blastx,tblastn,tblastx中的一个 -d 数据库名称,默认nr -i 查询序列文件,默认stdin -e

文档评论(0)

ki66588 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档