如何运用BLAST进行序列比对.docVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
如何运用BLAST 进行序列比对、检验引物特异性 提到序列比对,绝大多数人都会想到BLAST,但BLAST 的使用确实又是一个很大的难题,因为他的功能比较强悍,里面涉及到的知识比较多,而且比对结束后输出的结果参数(指标)又很多。如果把BLAST 的使用详细的都讲出来,我想我发帖发到明天也发不完,更何况我自己也不是完全懂得BLAST 的使用。所以我在这里也就“画龙点睛”——以比对核酸序列为例来给大家介绍一下BLAST 的使用,也算是BLAST 的入门课程吧。请大家好好体会,如果你用心看,在看帖完毕之后BLAST 的基本使用(包括其他序列的比对)应该没有问题了。 1.打开BLAST 页面,/BLAST/ 打开后如图所示: 对上面这个页面进行一下必要的介绍: BLAST 的这个页面主体部分(左面)包括了三部分:BLAST Assembled Genomes、Basic BLAST、Specialized BLAST。相信大家可以看懂这三个短语的意思,我就不多说了;我要说的是,可以认为这是三种序列比对的方法,或者说是BLAST 的三条途径。 第一部分BLAST Assembled Genomes 就是让你选择你要比对的物种,点击相应物种之后即可进入比对页面。 第二部分Basic BLAST 包含了5 个常用的BLAST,每一个都附有简短的介绍。 第三部分Specialized BLAST 是一些特殊目的的BLAST,如dart、GEO、IgBLAST、SNP 等等,这个时候你就需要在Specialized BLAST 部分做出适当的选择了。 总之,这是一个导航页面,它的目的是让你根据自己的比对目的选择相应的BLAST 途径。下面以最基本的核酸序列比对来谈一下BLAST 的使用,期间我也会说一下其他序列比对的方法。 2. 点击Basic BLAST 部分的nucleotide blast 链接到一个新的页面。打开后如图所示: 介绍一下上述页面: Enter Query Sequence 部分是让我们输入序列的,你可以直接把序列粘贴进去,也可以上传序列,还可以选择你要比对的序列的范围(留空就代表要比对你要输入的整个序列)。 Job Title 部分还可以为本次工作命一个名字。 Choose Search Set 部分是让我们选择要与目的序列比对的物种或序列种类(genome DNA、mRNA 等等)。如果是人或小鼠的话,就可以直接选择了如果是其他物种就要选择“others”了,这时候网页会主动跳出一个下拉对话框和一个输入式对话框,你可以分别选择和输入要跟你的序列比对的序列种类和物种。下面的Entrez Query 可以对比对结果进行适当的限制。 Program Selection 部分其实是让我们选择本次比对的精确度,种内种间等等。 在BLAST 按钮下面有一个“Algorithm parameters” ,这是参数设置选项,一般用户使用不到此项,所以它比较隐蔽,点击,原网页下方即可增加了Algorithm parameters 的内容。大部分人都用不到更改这里面的选项,我也不多说了,有兴趣的朋友可以自己研究一下。 依次填写上述网页必须部分,点击BLAST 按钮后,出现如下界面(只截取其中二部分): 出现的这个结果页面信息含量非常大,如果我们用心观察,还是可以发现其中的一些主要指标的。列举上图也是为了给大家展示一下这些评价标准。其中Description 部分推荐大家详细看一下,另外说一下“E value” 这个指标与其他指标不同,它的数值越小相似程度越高,其他几个(如Totle score)都是数值越高相似度越高。 注意:除可以比对设计的引物序列,还可以比对蛋白质的氨基酸序列,即从未知蛋白质的氨基酸序列找到相当的蛋白质。 。。。。。。。 输出结果分四部分: 1、第一部分:Accession为数据库名称,配对序列存取号,基因位点名称。 2、第二部分:Description是对序列的简单文字描叙和定义行。(包括序列来源、类型和一些功能或表型信息)。 3、第三部分:序列的比对分值。 4、第四部分:期望阈值E(E值越小越好)。

文档评论(0)

zhuliyan1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档