生物信息学理论3-BLAST.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

生物信息学

Bioinformatics

王鹏

生物信息学3-BLAST

上节回顾

•了解生物信息检索系统Entrez及SRS。

•掌握相似性与同源性的定义及区别。

•BLAST的定义。

2.1数据库检索

生物信息检索系统

Entrez:

网址:/entrez

它是NCBI著名的用于提取序列信息的工具。

SRS(SequenceRetrievalSystem)

SRS由EMBL(欧洲分子生物学实验室)开发的以

万维网界面运行的生物数据库检索系统。

2.2数据库搜索相似序列

2.2.1相似性和同源性关系——概念

•相似性(similarity):

是指一种很直接的数量关系,比如部分相同或

相似的百分比或其它一些合适的度量。

•同源性(homology):

指从一些数据中推断出的两个基因或蛋白质序

列具有共同祖先的结论,属于质的判断。

2.2数据库搜索相似序列

2.2.1相似性和同源性关系——应用

•序列相似性比较:

就是将待研究序列与DNA或蛋白质序列库

进行比较,用于确定该序列的生物属性,也就

是找出与此序列相似的已知序列是什么。完成

这一工作只需要使用两两序列比较算法。

常用的程序包有BLAST、FASTA等。

2.2数据库搜索相似序列

2.2.2什么是BLAST

BLAST是由美国国立生物技术信息中心

(NCBI)开发的一个基于序列相似性的数据库

搜索程序。

BLAST是“局部比对搜索基本工具”(Basic

LocalAlignmentSearchTool)的缩写。

别名,教材:局部比对搜索基本工具

“局部相似性基本查询工具”

生物大分子序列比对搜索工具

“基于局部比对算法的搜索工具”

2数据库的使用

2.1数据库检索

2.2数据库搜索相似序列

2.3序列提交

2.2数据库搜索相似序列

2.2.1相似性和同源性关系

2.2.2什么是BLAST

2.2.3基本BLAST程序

2.2.4BLAST基本原理

2.2.5BLAST应用

2.2.6FASTA的应用

2.2数据库搜索相似序列

2.2.4BLAST基本原理—Step1

•滤去低复杂度区域(LowComplexityRegion,LCR)

低复杂度区域(LCR)一般指重复的能缩小不同

序列间差异的序列片段。主要包括一些基因序列

的固定结构,

如:PolyA尾;Alu序列;

有多个重复序列的短序列片段;

某个字母的大量重复。

真核生物的基因结构示意图

氨基酸分类

alanine丙氨酸AlaA

phenylalanine苯丙氨酸PheF

leucine亮氨酸LeuL

isoleucine异亮氨酸IleI非极性疏水性

valine缬氨酸ValV氨基酸

proline脯氨酸ProP

methionine甲硫氨酸Met

文档评论(0)

良渚. + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档