蛋白质结构预测基本思想.docVIP

下载本文档

18
0
约2.92千字
约 3页
2015-07-22 发布于安徽
举报
版权申诉

蛋白质结构预测基本思想.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

蛋白质结构预测的基本思想蛋白质结构预测的问题从数学上讲，是寻找一种从蛋白质的氨基酸线性序列到蛋白质所有原子三维坐标的一种映射。典型的蛋白质含有几百个氨基酸、上千个原子，而大蛋白质（如载脂蛋白）的氨基酸个数超过4500。所有可能的序列到结构的映射数随蛋白质氨基酸残基个数而呈指数增长，是天文数字。然而幸运的是，自然界实际存在的蛋白质是有限的，并且存在着大量的同源序列，可能的结构类型也不多，序列到结构的关系有一定的规律可循，因此蛋白质结构预测是可能的。蛋白质结构预测主要有两大类方法：理论分析方法或从头算方法（Abinitio）：通过理论计算（如分子力学、分子动力学计算）进行结构预测，该类方法假设折叠后的蛋白质取能量最低的构象。从原则上来说，我们可以根据物理、化学原理，通过计算来进行结构预测。但是在实际中，这种方法往往不适合。主要有几个原因，一是自然的蛋白质结构和未折叠的蛋白质结构，两者之间的能量差非常小（1kcal/mol数量级），二是蛋白质可能的构象空间庞大，针对蛋白质折叠的计算量非常大。另外，计算模型中力场参数的不准确性也是一个问题。统计方法：该类方法对已知结构的蛋白质进行统计分析，建立序列到结构的映射模型，进而对未知结构的蛋白质根据映射模型直接从氨基酸序列预测结构。映射模型可以是定性的，也可以是定量的。这是进行蛋白质结构预测较为成功的一类方法。这一类方法包括经验性方法、结构规律提取方法、同源模型化方法等。所谓经验性方法就是根据一定序列形成一定结构的倾向进行结构预测，例如，根据不同氨基酸形成特定二级结构的倾向进行结构预测。通过对已知结构的蛋白质（如蛋白质结构数据库PDB、蛋白质二级结构数据库DSSP中的蛋白质）进行统计分析，发现各种氨基酸形成不同二级结构的倾向，形成一系列关于二级结构预测的规则。与经验性方法相似的另一种办法是结构规律提取方法，这是更一般的方法。该方法从蛋白质结构数据库中提取关于蛋白质结构形成的一般性规则，指导建立未知结构的蛋白质的模型。有许多提取结构规律的方法，如通过视觉观察的方法，基于统计分析和序列多重比对的方法，利用人工神经网络提取规律的方法。同源模型化方法通过同源序列分析或者模式匹配预测蛋白质的空间结构或者结构单元（如锌指结构、螺旋-转角-螺旋结构、DNA结合区域等）。其原理是基于下述事实：每一个自然蛋白质具有一个特定的结构，但许多不同的序列会采用同一个基本的折叠，也就是说，具有相似序列的蛋白质倾向于折叠成相似的空间结构。一对自然进化的蛋白质，如果它们的序列具有25～30%的等同部分或者更多，则可以假设这两个蛋白质折叠成相似的空间结构。这样，如果一个未知结构的蛋白质与一个已知结构的蛋白质具有足够的序列相似性，那么可以根据相似性原理给未知结构的蛋白质构造一个近似的三维模型。如果目标蛋白质序列的某一部分与已知结构的蛋白质的某一结构域区域相似，则可以认为目标蛋白质具有相同的结构域或者功能区域。在蛋白质结构预测方面，预测结果最可靠的方法是同源模型化方法。蛋白质的同源性比较往往是借助于序列比对而进行的，通过序列比对可以发现蛋白质之间进化的关系。在蛋白质结构分析方面，通过序列比对可以发现序列保守模式或突变模式，这些序列模式中包含着非常有用的三维结构信息。利用同源模型化方法可以预测所有10～30%蛋白质的结构。然而，有许多具有相似结构的蛋白质是远程同源的，它们的等同序列不到25%，也就是说，具有相似空间结构的蛋白质序列等同程度可能小于25%。这些蛋白质的同源性不能被通过传统的序列比对方法所识别。如果按照一个未知序列搜索一个蛋白质序列数据库，并且搜索条件为序列等同程度小于25%的话，那么将会得到大量不相关的蛋白质。因此，搜索远程同源蛋白质就像在干草堆里寻找一根针。寻找远程同源蛋白质是一项困难的任务，处理这个困难任务的技术称为“线索（THREADING）技术”。对于一个未知结构的蛋白质，仅当我们找不到等同序列大于25%的已知结构的同源蛋白质时，才通过线索技术寻找已知结构的远程同源蛋白质，进而预测其结构。找到一个远程同源蛋白质后，利用远程同源建模方法来建立蛋白质的结构模型。如果既没有找到一般的同源蛋白质，又没有找到远程同源蛋白质，那么如何进行结构预测呢？一种可行的办法就是充分利用现有数据库中的信息，包括二级结构和空间结构的信息，首先从蛋白质序列预测其二级结构，然后再从二级结构出发，预测蛋白质的空间结构；或者采用从头算方法进行结构预测。蛋白质结构预测常用数据库：说明1 J1 E# f ]. Q8 U5 网址链接 PDB5 ^ `/ 蛋白质三维结构* S! i% h7 @* s7 L) R6 k /pdb SWISS-PROT# n; 蛋白质序列数据库7 A, `. d6 [, H8 q /sprot/