蛋白質预测.pptVIP

下载本文档

7
0
约7.68千字
约 81页
2017-04-22 发布于上海
举报
版权申诉

蛋白質预测.ppt

1、本文档共81页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

蛋白質预测

蛋白质预测;序列------结构------功能;Protein structure prediction:The holy grail of bioinformatics;一、蛋白质结构;氨基酸的分类： 1. 体积； 2. 亲疏水性 3. 极性；4. 正负电荷 5. 酸碱性；6. 脂肪族/芳香族三个比较特殊的氨基酸：脯氨酸(P，Pro)：是环状的亚氨基酸，易形成顺式肽链；甘氨酸(G，Gly)：α碳原子上有两个氢，没有侧链，不和其它残基互作，没有位阻；半胱氨酸(C，Cys)：高度化学反应活性，易形成二硫键。;维持和稳定蛋白质高级结构的因素： 1. 静电作用：严格服从库仑定律 2. 氢键：在二级结构形成中，十分重要 3. 范德华力：蛋白质分子巨大，此力不可忽视 4. 亲疏水性：三级结构中，至关重要 5. 配位键：例如金属蛋白 6. 二硫键：蛋白质的稳定十分有用 7. 其它因素：翻译后修饰;Primary structure = the linear amino acid sequence;;规则的二级结构： 1) α螺旋：最常见每圈螺旋含有3.6AA，平均11AA 其它一些螺旋：310螺旋，π螺旋;2) β折叠: 平均6.5AA，可看成被拉伸的α螺旋；单股β折叠不稳定，会形成β片层；;An antiparallel β sheet. Adjacent β strands run in opposite directions. Hydrogen bonds between NH and CO groups connect each amino acid to a single amino acid on an adjacent strand, stabilizing the structure.;A parallel β sheet. Adjacent β strands run in the same direction. Hydrogen bonds connect each amino acid on one strand with two different amino acids on the adjacent strand.;部分规则二级结构： 1）转角：β、γ、π转角 β转角对蛋白质的功能和进化有重要意义。 2） Ω环 3）无规卷曲许多特殊的生物学功能都发生在无规卷曲或其他非规则的结构中。;3. 二级结构预测;二级结构预测;1）二级结构预测概述蛋白质的二级结构预测的基本依据是：每一段相邻的氨基酸残基具有形成一定二级结构的倾向。二级结构预测问题是模式分类问题二级结构预测的目标：判断每一段中心的残基是否处于螺旋、折叠、无归卷曲（或其它状态）之一的二级结构态，即三态。 ;基本策略（1）相似序列→相似结构;基本策略（2）分类分析; 2）二级结构预测的参数大体分为三代：第一代是基于单个氨基酸残基统计分析从有限的数据集中提取各种残基形成特定二级结构的倾向，以此作为二级结构预测的依据。第二代预测方法是基于氨基酸片段的统计分析统计的对象是氨基酸片段片段体现了中心残基所处的环境在预测中心残基的二级结构时，以残基在特定环境形成特定二级结构的倾向作为预测依据 ;第一代和第二代参数预测方法对三态预测的准确率一般都小于70% 第三代方法（考虑多条序列，综合算法）运用长程信息和蛋白质序列的进化信息准确度有了比较大的提高，一般能上70%。;（1）经验参数法由Chou 和Fasman在70年代提出来是一种基于单个氨基酸残基统计的经验预测方法。通过统计分析，获得的每个残基出现于特定二级结构构象的倾向性因子，进而利用这些倾向性因子预测蛋白质的二级结构。例如：谷氨酸(Glu)主要出现在?螺旋中天冬氨酸(Asp)和甘氨酸(Gly)主要分布在转角中脯氨酸(Pro)也常出现在转角中，但是基本不会出现在? 螺旋中;一个氨基酸残基的构象倾向性因子定义为 Pi = Ai / Ti (i= ?,β, t) 式中下标 i 表示构象态如?螺旋、β折叠、转角等； Ti 是所有被统计残基处于构象态 i 的比例； Ai 是第A种残基处于构象态 i 的比例； Pi 大于1表示该残基倾向于形成二级结构构象i， Pi小于1则表示倾向于形成其它构象。 ;%; 发现关于二级结构的经验规则基本思想是在序列中寻找规则二级结构的成核位点和终止位点。扫描输入的氨基酸序列，利用一组规则发现可能成为特定二级结构成核区域的短序列，然后对于成核区域进行扩展，不断扩大成核区域，直到倾向性因子小于1.0为止。规则：（i）α螺旋规则