蛋白质结构预测讲义.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五节 蛋白质空间结构比较 结构域 对蛋白质进行序列比较,可以发现同源序列的保守区域。 但是对于结构域,通过序列比较,我们只能得到一部分信息。 如果在结构这个层次上进行比较,可以发现更多的信息。 蛋白质的结构比序列更加保守,通过比较蛋白质的空间结构,可以发现属于同一家族蛋白质的保守结构,可以发现特定的空间结构模式。 这些模式由多个不相邻的序列片段组成,经过蛋白质折叠以后,这些一维不相邻的元素在三维空间中结合到一起,形成特定的功能位点,如酶的活性部位,蛋白质结合部位等。 蛋白质结构比较有两个主要的任务: 检测蛋白质的结构特征 在已知两个蛋白质对应结构特征的条件下,寻找将两个蛋白质空间结构重叠的几何变换,进行三维结构的比对(alignment)。 如果用数学语言来描述,就是给定两个三维点集P={pi}和 Q={qi} (i=1,2,…,n),寻找一个空间变换矩阵T,使得 最小,即: 这个问题可以用最小二乘法解决 空间点三元组几何变换 目标: 寻找两个蛋白质空间点三元组重叠最多的几何变换。 解决这个问题的直接算法是如下: (1)对于每一对空间点三元组(分别来自不同的蛋白质),计算能使这两个对象重叠的几何变换; (2)统计在各种变换中,能够同时重叠、或者基本重叠的空间点三元组个数,并作为对应变换的得分; (3)选择得分比较高的变换,改进这些变换,使其得分进一步提高。 基于几何哈希(geometric hashing)技术的三维结构比对方法 将目标分子与数据库中模型分子匹配 数据库中的模型分子是预先建立的。对于每个模型分子,按照下述步骤进行预处理: (1)挑选参考框架,即挑选模型分子中非共线的三个点; (2)计算参考框架的三维正交基及其形状特征(例如,三角形边的长度); (3)计算参考框架一定范围内所有其它点的坐标; (4)以每个坐标作为哈希查找表的地址,在哈希表相应的位置存贮蛋白质的有关信息,如蛋白质的标识符,参考文献、形状特征等; (5)对于每个参考框架(模型分子中非共线的三个点)重复上述过程。 识别阶段 利用前面预处理所得到的哈希表进行识别,过程如下: 对于每个目标分子的参考框架,计算参考框架的三维正交基及其形状特征,计算参考框架内其它点的坐标,将每个坐标作为哈希查找表的地址,在哈希表相应的位置取出有关的信息,找出形状特征匹配的记录,然后针对那些匹配好的记录计算相应的空间变换,保存匹配的点。 计算不同空间变换下匹配点对的个数,形成匹配表。选择匹配点对多的匹配表作为进一步匹配的出发点,这样的匹配表中所包含的匹配又称为“种子匹配”。其基本思路与序列快速比较算法BLAST相似。 蛋白质结构预测 结构预测流程 Protein sequence Database similarity search Does sequence align with protein of known 3D structure? Protein family, domain, cluster analysis Relation-ship to known structure? Structural analysis 3D comparative modeling Predicted three dimensional structure Is there a predicted structure? 3D analysis in laboratory yes no no no 蛋白质三维结构预测 1、同源模型化方法 主要思想: 对于一个未知结构的蛋白质,找到一个已知结构的同源蛋白质,以该蛋白质的结构为模板,为未知结构的蛋白质建立结构模型。 依据: 任何一对蛋白质,如果两者的序列等同部分超过30%,则它们具有相似的三维结构,即两个蛋白质的基本折叠相同,只是在非螺旋和非折叠区域的一些细节部分有所不同。 假设待预测三维结构的目标蛋白质为U(Unknown),利用同源模型化方法建立结构模型的过程包括下述6个步骤: (1)搜索结构模型的模板(T) (2)序列比对 (3)建立骨架 (4)构建目标蛋白质的侧链 (5)构建目标蛋白质的环区 (6)优化模型 U ? T 构建目标蛋白质的侧链 预测结果准确率: 对于具有60%等同的序列,用上述方法所建立的三维模型非常准确。若序列的等同部分超过60%,则预测结果将接近于实验得到的测试结果。 一般如果序列的等同部分大于30%,则可以期望得到比较好的预测结果。 2、线索化方法(折叠识别方法) 有很多蛋白质具有相似的空间结构,但它们的序列等同部分小于25%,即远程同

文档评论(0)

benzei244572 + 关注
实名认证
内容提供者

建筑工程师持证人

没啥好说的额

领域认证该用户于2024年10月16日上传了建筑工程师

1亿VIP精品文档

相关文档