《蛋白质组学研究的数据库(二)》.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
蛋白质组学研究的数据库 从序列进行功能预测 BLAST分析是序列比对的强有力工具但是应用到功能预测上可能不精确。BLAST结果从比对的长度和比对区域的相似性获得。必须注意不能将一个蛋白质的描述简单地转移到另外一个相关的蛋白质上,该蛋白质可能只是享有一个共同但是高度保守的结构域。DNA序列数据库中的功能注解有时是误导的,因为提交者拷贝了基于共享结构域的功能注释,而它们对全长蛋白质的功能是偶然的。如果反复拷贝到数据库中,这些错误会导致注解灾难。 大多蛋白质含有多个结构域,而描述与这些结构域相关的功能对于蛋白质注解是关键的。幸运的是现在已经有了结构域分析有效的数据库和工具。最早的是PROSITE,是SWISS-PROT的伙伴数据库。这个数据库将结构域和基元做成序列一致模式的图表并提供了优秀的注解。其它结构域数据库包括Pfam、BLOCK、ProDOM、PRINT和SMART。它们提供不同的算法生成许多不同类型的图谱(隐藏的Markov模式、签名、指纹或者模块)用统计学定义结构域。 为了增强这些结构域数据库的功能,一个叫做InterPro的协会将它们其中的一些结合成为一个统一的形式。InterPro允许所有成员数据库用关键词或者序列(用近来补充的InterProScan) 同时进行搜索并呈现统一的、非重复的注解。InterPro目前代表结构域分析最完全的资源,但是SMART也可以被推荐。SMART包含的结构域要少(与InterPro的3000个相比只有400个),但是这样能够将更多的注意力投到这些结构域的功能注解上。另外,SMART有InterPro或其它结构域数据库所没有的特点,诸如结构域的分类分布,通过结构域结构(按照一个固定的顺序排列结构域)以及结构域组成(含有同样的结构域而不管它们的次序)搜索。(/zt/experiment/ 生物实验技术) 现在已经有了结构预测的可靠算法。尽管只从原始序列的预测仍然不可靠,但是蛋白质穿线方法(基于一个相关蛋白质的已知结构预测结构)经常证明在蛋白质定性中证明有帮助。相关蛋白质享有共同的结构因此当一个蛋白质家族中的一个成员的结构确定后它允许预测同一家族中其它蛋白质的结构。因为结构分析算法是计算机密集的,大多公共搜索网址依赖于储存的、预先计算好的搜索。一个这样的资源是蛋白质数据库的中间序列文库(PDB-ISL)。基于SCOP(蛋白质的结构分类)中的手工定义的结构分类,PDB-ISL使得研究者能够发现与那些与已经解决结构的蛋白质在结构上相关的蛋白质。结果是与查询序列的特殊区域相对应的折叠列表(一系列特殊排列以及有特殊关联的二级结构)。通过检测这个列表可以发现有关该蛋白质可能结构的线索。尽管蛋白质穿线方法在此综述范围之外,结果可能是印象深刻的、特别是查询和模板序列之间的相同程度高的时候。如果序列等同小于30%,结果就不可靠需要小心。 3DCrunch网址含有来自SWISS-PROT和TreEMBL记录的理论模型。如果一个兴趣蛋白质不在SWISS-PROT或者3DCrunch中,在ExPASy的SWISS-MODEL网址提供基于符合PDB结构作为模板的结构基础上的建立蛋白质模型的工具。另外一个发现理论模型的有用的数据库是MODBASE,它含有对应于大约17000个蛋白质的模型,包括几近完整的酿酒酵母的蛋白质组。酵母蛋白质结构资源在酵母基因组数据库网址可以作为Sacch3D获得。3维模型突出强调对于结构和功能最为关键的氨基酸,通过聚焦这些关键残基允许蛋白质的比对。这些改进的比对允许评估那些仅仅用BLAST比较认为不显著的远处的相似。理论上和同源性为基础的蛋白质-结构模型的精确性因为正在进行的结构基因组学变得可行应该进一步增高。 (/news/orgnization/ 生命科学研究所) 一个结构为基础搜索的特征是可以识别结构相似而不享有相同演化祖先的蛋白质。如果一个注解的蛋白质与兴趣蛋白质相似就值得检查是否是通过趋同进化各自独立演化而来。在NCBI上结构报告上的预先计算的载体比对搜索工具(VAST)比对允许快速链接到结构邻居,其方式类似于NCBI核酸或蛋白质报告所能获得的与蛋白质或核酸邻居的链接。到一个结构报告的最快的途径是在PDB数据库进行目的蛋白质的BlastP搜索并查看作为结构报告的结果。 分析决定蛋白质最终亚细胞定位的分类信号能够辅助蛋白质功能的理解。PSORT II是最近版本的算法,它用统计学估计序列中一些模式的存在情况(诸如N末端信号序列、核定位信号、跨膜片断和卷曲结构)从而预测蛋白质的亚细胞定位并产生一个积分指示该预测的可靠性。 用模型有机体和文献数据库的功能分析 模型有机体蛋白质的生物化学和遗传学定性已经提供了一些个体蛋白质、蛋白质复合体以及蛋白质通路功能的深入

文档评论(0)

feijiaolike + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档