- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
;BLAST简介
BLAST 的算法
BLAST 搜索策略;BLAST是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。
BLAST程序能迅速与公开数据库进行相似性序列比较,采用一种局部的算法获得两个序列中具有相似性的序列,其结果中的得分是对一种对相似性的统计说明。;BLAST的应用;BLAST中常用的程序介绍;程序 输入 数据库
1
blastn DNA DNA
1
blastp protein protein
6
blastx DNA protein
6
tblastn protein DNA
36
tblastx DNA DNA;BLAST算法
可找到一个查询序列和一个数据库序列之间的匹配关系,然后向两个方向延伸。搜索结果既包括数据库中高度相关的序列,也包括边缘性相关区域,并用一个打分图描述查询序列与每个数据库匹配之间的相关程度。
分为三个阶段:列表、扫描、延伸;Phase 1: 列表 (w=3)
编译一个由查询序列生成的长度固定为w的“字段”列表。针对比对字段打分建立阈值T,大于T的字段被定义为匹配。;比对得分由一个打分矩阵确定,如Blosum62;Phase 2:扫描
在数据库中扫描与编译列表匹配的记录。
最初blast运行只寻找一个匹配,目前版本需要寻找两个相隔一定距离A的相互分离的字段(如两个没有重叠区域的字段),然后生成这两个匹配的一个无空位的延伸。
提高了搜索速度,匹配量增加,但只需要进行原来1/7的延伸操作。
参数A的默认值为40。;当找到一个匹配(hit),像两个方向延伸匹配序列;
追踪分值大小(使用打分矩阵);
当分值下降时停止。;;;;期望值(expect value) E,是在一次数据库搜索中,随机条件下期望发生的得分等于或大于S的不同比对的数目;
E值与概率p相关;
描述E值的公式:
E = Kmn e-lS;如何评估结果的显著性
如何处理太多的结果
如何处理太少的结果
利用一个多结构域蛋白(HIV-1 pol)进行BLAST搜索
利用不同矩阵进行BLAST搜索;如何评估结果的显著性;A中只有36个氨基酸的RBP4框架就可以得到与RBP4和B的较长的匹配(151个氨基酸)相同的得分与期望值。
但相似比率相差很大(94% vs 31%);RBP4和NP_002562.1(PAEP,孕激素相关子宫内膜蛋白):
E值0.49, 不显著,
一致性:24% (“twilight zone”,模糊区)。
但实际上二者是同源的。;以PAEP进行blastp搜索的结果;如何评估结果的显著性;是否共有一个相似的生物学功能?
是否具有相似的三维结构?
如果一个blast搜索得到一个对另一个的边缘匹配,以这个具有较远亲缘关系的蛋白质作为查询项再进行一次blast。如果互相印证,则增加是了同源的信心。;如何处理太多的结果;如何处理太少的结果;Thank you !
文档评论(0)