蛋白质组学研究的数据库(二).docVIP

  • 40
  • 0
  • 约7.89千字
  • 约 6页
  • 2016-08-22 发布于贵州
  • 举报
蛋白质组学研究的数据库(二)

蛋白质组学研究的数据库 从序列进行功能预测 BLAST分析是序列比对的强有力工具但是应用到功能预测上可能不精确。BLAST结果从比对的长度和比对区域的相似性获得。必须注意不能将一个蛋白质的描述简单地转移到另外一个相关的蛋白质上,该蛋白质可能只是享有一个共同但是高度保守的结构域。DNA序列数据库中的功能注解有时是误导的,因为提交者拷贝了基于共享结构域的功能注释,而它们对全长蛋白质的功能是偶然的。如果反复拷贝到数据库中,这些错误会导致注解灾难。 大多蛋白质含有多个结构域,而描述与这些结构域相关的功能对于蛋白质注解是关键的。幸运的是现在已经有了结构域分析有效的数据库和工具。最早的是PROSITE,是SWISS-PROT的伙伴数据库。这个数据库将结构域和基元做成序列一致模式的图表并提供了优秀的注解。其它结构域数据库包括Pfam、BLOCK、ProDOM、PRINT和SMART。它们提供不同的算法生成许多不同类型的图谱(隐藏的Markov模式、签名、指纹或者模块)用统计学定义结构域。 为了增强这些结构域数据库的功能,一个叫做InterPro的协会将它们其中的一些结合成为一个统一的形式。InterPro允许所有成员数据库用关键词或者序列(用近来补充的InterProScan) 同时进行搜索并呈现统一的、非重复的注解。InterPro目前代表结构域分析最完全的资源,但是SMART也可

文档评论(0)

1亿VIP精品文档

相关文档