α螺旋、β折叠和转角.ppt

下载文档 降价啦

500
0
约 60页
2017-09-06 发布于天津
举报
版权申诉
保障服务

α螺旋、β折叠和转角.ppt

1、本文档共60页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

α螺旋、β折叠和转角

蛋白质结构预测蛋白质结构为什么如此重要的？为什么要研究蛋白质结构? 生物体中许多重要的功能由蛋白质完成催化作用、营养物质运输、生长和分化控制和生物信号的识别和传递等等分析蛋白质结构、功能及其关系是蛋白质组计划中的一个重要组成部分已知序列的蛋白质数量与已测定结构的蛋白质数量的差距正逐步拉大 Swissprot已经有140000条蛋白质序列 PDB中已知结构的只有其中的约10% 为什么要研究蛋白质结构? 对于未知功能或新发现的蛋白质分子，通过结构分析，可以进行功能注释，指导设计进行功能确认的生物学实验分析蛋白质结构有助于药物设计研究有助于了解蛋白质相互作用，这对于生物学、医学和药学都是非常重要通过实验方法得到蛋白质结构花费高且耗时长蛋白质生物学基础蛋白质一个蛋白质分子是由有序的氨基酸链折叠而成的(从30到30000个残基不等) 氨基酸 20种不同的氨基酸蛋白质二级结构 a-helix (30-35%)a-螺旋 b-sheet / b-strand (20-25%)b-折叠 Coil (40-50%) 无规则卷曲 Loop 环 b-turn b-转角 α螺旋 Β折叠蛋白质结构分类蛋白质结构分类 Class (10) 结构类 Folds (1000) 折叠子 Superfamily 超家族序列或结构相似 Family 家族序列相似性 25% ~ 30% 同源染色体蛋白质结构预测蛋白质的结构决定其生物学功能蛋白质的结构由蛋白质序列决定从数学上讲，蛋白质结构预测的问题是寻找一种从蛋白质的氨基酸线性序列到蛋白质所有原子三维坐标的映射自然界存在的蛋白质数目有限，蛋白质结构预测是可能的从实验上测定蛋白质结构 X-射线衍射法最准确在体外进行需要结晶的蛋白 NMR（核磁共振）较准确在体内不需要结晶限定在小分子量蛋白 X-射线衍射法慢且费用高不能应用于所有的蛋白二级结构预测预测的基本依据：每一段相邻的氨基酸残基具有形成一定二级结构的倾向蛋白质中约85%的氨基酸残基处于3种基本二级结构状态（α螺旋、β折叠和转角）二级结构预测的目标是判断每一个氨基酸残基是否处于α螺旋、β折叠和转角（或其它状态）之一的二级结构态，即三态通常为蛋白质空间结构预测的第一步二级结构预测方法的第一代方法第一代方法：基于单个氨基酸残基统计分析，从有限的数据集中提取各种残基形成特定二级结构的倾向，以此作为二级结构预测的依据最具代表性的方法： Chou-Fasman (1974) 准确率约为50%-60% 二级结构预测方法的第二代方法第二代方法：基于氨基酸片段的统计分析，片段的长度通常为11-21个氨基酸最常用方法：GOR method (1978) 准确率稍高于60% 存在许多不同的算法：统计信息(Statistical information) 神经网络(Neural networks) 多变量统计学(Multivariate statistics) 图论(Graph theory) 最邻近方法(Nearest Neighborhood Methods) 第一、二代方法存在的问题预测准确率均小于70% 在预测β折叠方面很不理想，准确率只有28-48%，只考虑了局部信息能够预测的螺旋与折叠都比较短二级结构预测方法的第三代方法第三代方法：通过运用多序列比对显著改善了预测方法相似序列往往具有相似结构理论在大的相互作用方面提供了有利线索序列相似性30%往往具有相似的蛋白结构 PSI-BLAST (Alstchul et. al. 1997)强有力的数据库搜索工具的加入准确率70% 二级结构预测常用方法 Chou-Fasman方法 GOR 方法基于氨基酸疏水性的预测方法人工神经网络方法最邻近方法 Chou-Fasman方法基于单个氨基酸残基统计的经验参数方法，由Chou和Fasman在1974 1978提出通过统计分析，获得每个残基出现于特定二级结构构象的倾向性因子，利用这些倾向性因子预测蛋白质的二级结构每种氨基酸残基出现在各种二级结构中的倾向或者频率是不同的，存在偏好性准确性在 50-60%之间 /fasta_www/chofas.htm 二级结构倾向性因子定义：Pi=Ai/Ti(i=α,β, t, c) 说明： i表示二级结构态，如α螺旋、 β折叠、转角和无规则卷曲等 Ti是所有被统计残基处于二级结构态i的比例 Ai是第A种残基处于结构态i的比例 Pi100表示该残基倾向于形成二级结构i; Pi＜100表示倾向于形成其它二级结构 Chou-Fasman参数 α螺旋规