蛋白质三维结构预测4.docVIP

下载本文档

49
0
约2.59万字
约 12页
2018-07-24 发布于江苏
举报
版权申诉

蛋白质三维结构预测4.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

蛋白质三维结构预测4

蛋白质三维结构预测 1、同源模型化方法同源模型化方法是蛋白质三维结构预测的主要方法（Blundell 1987）。对蛋白质数据库PDB分析可以得到这样的结论：任何一对蛋白质，如果两者的序列等同部分超过30%（对于排列长度大于80），则它们具有相似的三维结构，即两个蛋白质的基本折叠相同，只是在非螺旋和非折叠区域的一些细节部分有所不同。蛋白质的结构比蛋白质的序列更保守，如果两个蛋白质的氨基酸残基序列有50%相同，那么约有90%的(碳原子的位置偏差不超过3 ?。这是同源模型化方法在结构预测方面成功的保证。同源模型化方法的主要思想是：对于一个未知结构的蛋白质，首先通过同源分析找到一个已知结构的同源蛋白质，然后，以该蛋白质的结构为模板，为未知结构的蛋白质建立结构模型。这里的前提是必须要有一个已知结构的同源蛋白质。这个工作可以通过搜索蛋白质结构数据库来完成，如搜索PDB。同源模型化方法是目前一种比较成功的蛋白质三维结构预测方法。从上述方法介绍也可以看出，因为预测新结构是借助于已知结构的模板而进行的，选择不同的同源的蛋白质，则可能得到不同的模板，因此最终得到的预测结果并不唯一。假设待预测三维结构的目标蛋白质为U（Unknown），利用同源模型化方法建立结构模型的过程包括下述6个步骤：搜索结构模型的模板(T)。同源模型化方法假设两个同源的蛋白质具有相同的骨架。为待预测的蛋白质建立模型时，首先按照同源蛋白质的结构建立模板T。所谓模板是一个已知结构的蛋白质，该蛋白质的与目标蛋白质U的序列非常相似。如果找不到这样的模板，则无法运用同源模型法。序列比对。将目标蛋白质U的序列与模板蛋白质序列进行比对，使U的氨基酸残基与模板蛋白质的残基匹配。比对中允许插入和删除操作。建立骨架。将模板结构的坐标拷贝到目标U，仅拷贝匹配残基的坐标。在一般情况下，通过这一步建立目标蛋白质U的骨架。构建目标蛋白质的侧链。可以将模板相同残基的坐标直接作为目标蛋白质的残基坐标，但是对于不完全匹配的残基，其侧链构象是不同的，需要进一步预测。侧链坐标的预测通常采用已知结构的经验数据，如ROTAMERS 数据库(Janin et al., 1978; Ponder and Richards, 1987)。ROTAMERS含有所有已知结构蛋白质中的侧链取向,按下述过程来使用ROTAMER：从数据库中提取ROTAMER分布信息，取一定长度的氨基酸片段（对于螺旋和折叠取7个残基，其它取5个残基）；在U的骨架上平移等长的片段，从ROTAMER库中找出那些中心氨基酸与平移片段中心相同的片段，并且两者的局部骨架要求尽可能相同，在此基础上从数据库中取局部结构数据。构建目标蛋白质的环区。在第2步的序列比对中，可能加入空位，这些区域常常对应于二级结构元素之间的环区，对于环区需要另外建立模型。一般也是采用经验性方法，从已知结构的蛋白质中寻找相应的环区，拷贝其结构数据。如果找不到相应的环区，则需要用其它方法(Collura et al., 1993)。优化模型。通过上述过程为目标蛋白质U建立了一个初步的结构模型，在这个模型中可能存在一些不相容的空间坐标，因此需要进行改进和优化，如利用分子力学、分子动力学、模拟退火等方法进行结构优化。对于具有60%等同的序列，用上述方法所建立的三维模型非常准确。若序列的等同部分超过60%，则预测结果将接近于实验得到的测试结果。一般如果序列的等同部分大于30%，则可以期望得到比较好的预测结果。当然，这种计算方法要占用大量的计算时间，主要是由于第4步的数据库搜索过程耗时较多。如果序列的等同部分小于30%或更少，那么预测结果的准确性如何呢？随着U和T的相似度降低，比对这两个蛋白质序列所需插入的环（LOOPS）增多。为环区建立精确的三维模型意味着解决结构预测的问题。有许多具体的方法可用于为环区建立三维模型，其中最好的方法在一些情况下能够得到环区正确的取向。为环区建立三维模型的一种方法是分子动力学模拟。由于环区一般来说相对比较短，可以用分子动力学方法来模拟，但在动态模拟过程所需要的计算时间随着多肽链的残基数指数增长。然而，即使序列等同部分下降到25%-30%，同源模型化方法也能产生出未知结构蛋白质整体折叠的粗糙模型。对于这样初始模型可以进行优化。常常用分子动力学技术进行优化，以提高精度。通过分子动力学的进一步模拟，往往能够得到较好的结果。也可以用人工神经网络（如BP网）来预测同源蛋白质的空间结构。Bohr等人曾利用BP网预测同源蛋白质的折叠模式（Bohr et al.,1990），该方法应用距离点矩阵表示蛋白质的结构，同源蛋白质的距离矩阵相似。沿水平轴和垂直轴画出蛋白质序列，如果两个氨基酸Ｃ(原子之间的距离小于指定的距离，则在矩阵对应位置打上点标记。与二级结