蛋白质结构预测讲义.ppt

下载文档

50
0
约4.7千字
约 37页
2019-08-02 发布于广西
举报
版权申诉
保障服务

蛋白质结构预测讲义.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第五节蛋白质空间结构比较结构域对蛋白质进行序列比较，可以发现同源序列的保守区域。但是对于结构域，通过序列比较，我们只能得到一部分信息。如果在结构这个层次上进行比较，可以发现更多的信息。蛋白质的结构比序列更加保守，通过比较蛋白质的空间结构，可以发现属于同一家族蛋白质的保守结构，可以发现特定的空间结构模式。这些模式由多个不相邻的序列片段组成，经过蛋白质折叠以后，这些一维不相邻的元素在三维空间中结合到一起，形成特定的功能位点，如酶的活性部位，蛋白质结合部位等。蛋白质结构比较有两个主要的任务：检测蛋白质的结构特征在已知两个蛋白质对应结构特征的条件下，寻找将两个蛋白质空间结构重叠的几何变换，进行三维结构的比对（alignment）。如果用数学语言来描述，就是给定两个三维点集P={pi}和 Q={qi} （i=1,2,…,n），寻找一个空间变换矩阵T，使得最小，即：这个问题可以用最小二乘法解决空间点三元组几何变换目标：寻找两个蛋白质空间点三元组重叠最多的几何变换。解决这个问题的直接算法是如下：（1）对于每一对空间点三元组（分别来自不同的蛋白质），计算能使这两个对象重叠的几何变换；（2）统计在各种变换中，能够同时重叠、或者基本重叠的空间点三元组个数，并作为对应变换的得分；（3）选择得分比较高的变换，改进这些变换，使其得分进一步提高。基于几何哈希（geometric hashing）技术的三维结构比对方法将目标分子与数据库中模型分子匹配数据库中的模型分子是预先建立的。对于每个模型分子，按照下述步骤进行预处理：（1）挑选参考框架，即挑选模型分子中非共线的三个点；（2）计算参考框架的三维正交基及其形状特征（例如，三角形边的长度）；（3）计算参考框架一定范围内所有其它点的坐标；（4）以每个坐标作为哈希查找表的地址，在哈希表相应的位置存贮蛋白质的有关信息，如蛋白质的标识符，参考文献、形状特征等；（5）对于每个参考框架（模型分子中非共线的三个点）重复上述过程。识别阶段利用前面预处理所得到的哈希表进行识别，过程如下：对于每个目标分子的参考框架，计算参考框架的三维正交基及其形状特征，计算参考框架内其它点的坐标，将每个坐标作为哈希查找表的地址，在哈希表相应的位置取出有关的信息，找出形状特征匹配的记录，然后针对那些匹配好的记录计算相应的空间变换，保存匹配的点。计算不同空间变换下匹配点对的个数，形成匹配表。选择匹配点对多的匹配表作为进一步匹配的出发点，这样的匹配表中所包含的匹配又称为“种子匹配”。其基本思路与序列快速比较算法BLAST相似。蛋白质结构预测结构预测流程 Protein sequence Database similarity search Does sequence align with protein of known 3D structure? Protein family, domain, cluster analysis Relation-ship to known structure? Structural analysis 3D comparative modeling Predicted three dimensional structure Is there a predicted structure? 3D analysis in laboratory yes no no no 蛋白质三维结构预测 1、同源模型化方法主要思想：对于一个未知结构的蛋白质，找到一个已知结构的同源蛋白质，以该蛋白质的结构为模板，为未知结构的蛋白质建立结构模型。依据：任何一对蛋白质，如果两者的序列等同部分超过30%，则它们具有相似的三维结构，即两个蛋白质的基本折叠相同，只是在非螺旋和非折叠区域的一些细节部分有所不同。假设待预测三维结构的目标蛋白质为U（Unknown），利用同源模型化方法建立结构模型的过程包括下述6个步骤：（1）搜索结构模型的模板(T) （2）序列比对（3）建立骨架（4）构建目标蛋白质的侧链（5）构建目标蛋白质的环区（6）优化模型 U ? T 构建目标蛋白质的侧链预测结果准确率：对于具有60%等同的序列，用上述方法所建立的三维模型非常准确。若序列的等同部分超过60%，则预测结果将接近于实验得到的测试结果。一般如果序列的等同部分大于30%，则可以期望得到比较好的预测结果。 2、线索化方法（折叠识别方法）有很多蛋白质具有相似的空间结构，但它们的序列等同部分小于25%，即远程同

您可能关注的文档

文档评论（0）

benzei244572 + 关注: 实名认证

内容提供者

建筑工程师持证人

没啥好说的额

咨询Ta 进入空间

领域认证该用户于2024年10月16日上传了建筑工程师

1亿VIP精品文档

更多 >

蛋白质结构预测讲义.ppt