NCBI-blast-使用教程讲述.ppt

  1. 1、本文档共76页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
NCBI-blast-使用教程讲述

* 2. 在同一条对角线中临近的增强点成为一个增强段。每一个增强点都赋予一个正的分值,一个增强段中相邻的两个增强点之间的不匹配区域赋予一定的负值。一个增强段对应于一段相匹配的子序列,分值最高的段被标记为init1。 FASTA算法(二) * 引入indel。把那些没有重叠(non-overlap)的增强段拼接起来(增强段的分值之和减去空位处罚)。分值最高的区域记为initn。 FASTA算法(三) * 4. 对最有可能的匹配序列进一步评分:以增强段init1所在的对角线为中心,划分出一个较狭窄的对角线带,利用S-W算法,来获得分值最高的局部比对,记作opt。 FASTA算法(四) * 决定采用initn或opt的分值,前者敏感度低但速度快。FASTA对每一个检索到的比对都提供一个统计学显著性的评估,以判断该比对的意义。 FASTA算法(五) * * 注意… FASTA对DNA序列搜索的结果要比对蛋白质序列搜索的结果更敏感。它对数据库的每一次搜索都只有一个最佳的比对,一些有意义的比对可能被错过。 * 两个保守区域的信息 返回 * Dot matrix 分析 * 用Dot matrix分析基因中的重复序列 * 使用Dotter在斑马鱼序列的contig中定位ddah基因的位置 * A dot-matrix program with dynamic threshold control suited for genomic DNA and protein sequence analysis Erik L.L. Sonnhammer and Richard Durbin Gene 167(2):GC1-10 (1995) http://www.cgr.ki.se/cgr/groups/sonnhammer/Dotter.html * 作业 (一) 1.使用entrez获取登录号为P26374的蛋白序列,然后通过blastp,搜索nr库中最相似的10个序列(只显示10个最相似的序列)。 2. 获取M25113序列,blastp搜索SwissProt 库中的相似序列。 3. 获取P03958序列,进行psi-blast搜索,看看结果和blastp搜索有什么不同。 * 4.序列U93237,blastn搜索人类的est库,看看那些位置是外显子区域。 5.通过entrez随机获取一个蛋白激酶(protein kinase)的序列(核酸序列),然后通过blastn搜索该序列的同源序列。 6.尝试使用fasta搜索一序列的同源性,看看和blast的结果有什么不同。 作业 (二) * 本章结束! 如有问题,请联系 lsp01@ * * 分析过程(四) 8.输出格式选项保持默认值 9.点击开始搜索 * 分析过程(五) 10.查询序列的一些相关信息 在cdd库里面找到两个保守区域,点击可以进入 * 分析过程(六) 图形结果 * 分析过程(七) 匹配序列列表 * 分析过程(八) 具体匹配情况 * 为什么使用单机版的Blast? 1.特殊的数据库要求。 2.涉及序列的隐私与价值。 3.批量处理 4.其他原因?? 单机版的Blast使用(一) * 单机版Blast的基本操作过程 1.下载单机版的Blast程序 /blast/executables/ 目录下,下载对应的操作系统版本。 2.解压程序包(blast-2.28-ia32-linux.tar.gz) 命令是: $ tar zxvf blast-2.28-ia32-linux.tar.gz 单机版的Blast使用(二) * 下载正确的Blast程序包 blast:在本地运行的blast程序包 wwwblast:在本地服务器建立blast服务的网站 netblast:blast的客户端程序,直接链接至NCBI的BLAST服务器,使用BLAST服务,不需浏览器。 * 下载正确的Blast程序包 Blast程序包的名字上还包括了该程序包运行的硬件和操作系统环境: 硬件环境(CPU) 操作系统 sparc powerPC ia32 ia64 amd64 mips alpha linux macox solaris irix aix freebsd win32 hpux * 3.获取Blast数据库 a.直接从ncbi下载 /blast/db/ b.用Blast程序包提供的formatdb工具自己格 式化序列数据成数据库。 假设有一序列数据(sequence.fa,多序列,fasta格式),欲自己做成Blast数据库,典型的命令如下: 单机版的Blast使用(三) * 核酸序列: $ ./formatdb –i sequence.fa –p F –o T/

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档