- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
如何看懂NCBI BLAST输出结果
2010-11-13 10:38:11| 分类: 生物信息分析 | 标签:blast |字号大中小订阅
写在解读报告之前的,首先就使用Blast最终的目的是什么达成一致,Blast是通过两两比对,找到数据库中与输入序列最相似的序列,或者说是最 相似的序列片段。那么我们看比对结果就是看Blast从数据库中找到哪些相似的序列,然后就是如何相似,这些相似又可以告诉我们哪些信息 等。当然Blast可以衍生出许多的用途,但都是建立在找到相似性序列(片段)的基础上的。
最新的BLAST结果报告解读,本文以BLASTP为例子,说明如何来解读BLAST结果。
示例
BLAST地址:/Blast.cgi?PROGRAM=blastpBLAST_PROGRAMS=blastpPAGE_TYPE=BlastSearchSHOW_DEFAULTS=onLINK_LOC=blasthome
比对用的例子:giref|NP_445782.1| ribosomal protein L21 [Rattus norvegicus]MTNTKGKRRGTRYMFSRPFRKHGVVPLATYMRIYKKGDIVDIKGMGTVQKGMPHKCYHGKTGRVYNVTQHAVGIIVNKQVKGKILAKRINVRIEHIKHSKSRDSFLKRVKENDQKKKEAKEKGTWVQLNGQPAPPREAHFVRTNGKEPELLEPIPYEFMA
数据选择:nr
比对时间:2009年9月9日12:46:23
解读报告前需要掌握的概念
alignments 代表比对上的两个序列
hits 表示两个序列比对上的片段
Score 比对得分,如果序列匹配上得分,不一样,减分,分值越高,两个序列相似性越高E Value 值越小,越可信,相对的一个统计值。Length 输入序列的长度Identities 一致性,就是两个序列有多少是一样的Query 代表输入序列Sbjct 代表数据库中的序列
结果详细说明
菜单与基本信息
NCBI Blast结果-菜单与基本信息
下一步操作的菜单,你可以调整参数,重新比对、保存你的搜索条件以便下次比对、调整报告显示的参数,以更符合你的要求、下载你比对的结果;
此次比对的标题,优先是你填写的,如果没有填写可能是你输入fasta序列头(大于号后面的),如果这个也没有找到,NCBI会自动生成一个;
你输入序列的信息,包括标识号、描述信息、类型、长度;
数据库的信息以及你选择的Blast程序;
查看其他报告,比如摘要、分类、距离树、结构、多重比对等。
Graphic Summary
Graphic Summary
保守域,Blastp时,如果与保守域数据库比对有结果时,方显示;
Distribution of 100 Blast Hits on the Query Sequence,图的说明,仔细研读,是hits在输入序列上的分布;
这里是消息显示框,当鼠标放在坐标下的横线上,会显示代表的hit的信息;
颜色比例尺,代表hit的得分(score)区间,可以简单的理解为红色的线表示有较好的比对结果;
输入序列的坐标;
每一条线段代表一个hit,在线段上点击,会链接到该hit详细的比对信息部分。
深入理解:由于blast是区段比对,对于给定的两个序列,blast会把具有相识性的片段(hit)找出来,显示的是hit的信息,所以要 判断两个序列的相似性,不但要看比对上的片段(hit)的得分,还要看hit覆盖你输入序列的范围,正因为此,这部分图形显示部分就像 整个报告的鸟瞰图一样,hit在你输入序列上的分布。本例是一个较短的蛋白质序列,所以不具有代表性,试想如果输入的是M级的核酸序列,你就知道意味着什 么了。这里要记住仅仅高分的hit不能说明问题,还要关注hit在输入序列中的位置。
Descriptions
Descriptions
比对上序列的标识符,上面有到该序列详细信息的链接;
序列的表述信息,可以知道这个序列功能、基因、物种等信息;
比对得分,由高向低排列,上面有到比对详细信息的链接;
E value,由低向高排列;
该序列的其他链接,字母表示数据库,比如U表示unigene、G表示Gene数据库;
深入解读:简要的列表形式,便于阅读都比对上了哪些序列,(如果你经验丰富,从score的得分就大致可以判断序列的相似性)序列的相似情况。
Alignments
Alignments 比对详细信息
比对上的序列信息;
比对的各种得分,这里不做一一说明,不清楚请参看我的另一篇关于blast结果解析的文章(这里我最关注的是Identities,比对上(一 致)的数
您可能关注的文档
最近下载
- 高压除氧器培训课件.ppt VIP
- 最新行政执法题库行政执法试题及答案附答案详解(夺分金卷).docx VIP
- 最新行政执法题库行政执法试题及答案附答案详解(综合卷).docx VIP
- 最新行政执法题库行政执法试题及答案附答案详解(a卷).docx VIP
- 时速160客货共线铁路简支T梁-24m 通桥(2012)2101-II.pdf VIP
- 解密华为人资资源管理题库.docx VIP
- 最新行政执法题库行政执法试题及答案附答案详解(典型题).docx VIP
- 最新行政执法题库行政执法试题及答案附答案详解(基础题).docx VIP
- 大学生职业生涯规划.pdf VIP
- 个人电脑抵押合同4篇.docx VIP
原创力文档


文档评论(0)