- 1、本文档共81页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蛋白質预测
蛋白质预测;序列------结构------功能;Protein structure prediction:The holy grail of bioinformatics;一、蛋白质结构;氨基酸的分类:
1. 体积; 2. 亲疏水性
3. 极性;4. 正负电荷
5. 酸碱性;6. 脂肪族/芳香族
三个比较特殊的氨基酸:
脯氨酸(P,Pro):是环状的亚氨基酸,易形成顺式肽链;
甘氨酸(G,Gly):α碳原子上有两个氢,没有侧链,不和其它残基互作,没有位阻;
半胱氨酸(C,Cys):高度化学反应活性,易形成二硫键。;维持和稳定蛋白质高级结构的因素:
1. 静电作用:严格服从库仑定律
2. 氢键:在二级结构形成中,十分重要
3. 范德华力:蛋白质分子巨大,此力不可忽视
4. 亲疏水性:三级结构中,至关重要
5. 配位键:例如金属蛋白
6. 二硫键:蛋白质的稳定十分有用
7. 其它因素:翻译后修饰;Primary structure = the linear amino acid sequence;;规则的二级结构:
1) α螺旋:
最常见 每圈螺旋含有3.6AA,平均11AA
其它一些螺旋:310螺旋,π螺旋;2) β折叠:
平均6.5AA,可看成被
拉伸的α螺旋;
单股β折叠不稳定,
会形成β片层;;An antiparallel β sheet. Adjacent β strands run in opposite directions. Hydrogen bonds between NH and CO groups connect each amino acid to a single amino acid on an adjacent strand, stabilizing the structure.;A parallel β sheet. Adjacent β strands run in the same direction. Hydrogen bonds connect each amino acid on one strand with two different amino acids on the adjacent strand.;部分规则二级结构:
1)转角:β、γ、π转角
β转角对蛋白质的功能和进化有重要意义。
2) Ω环
3)无规卷曲
许多特殊的生物学功能都发生在无规卷曲或其他非规则的结构中。;3. 二级结构预测;二级结构预测;1)二级结构预测概述
蛋白质的二级结构预测的基本依据是:
每一段相邻的氨基酸残基具有形成一定二级结构的倾向。
二级结构预测问题是模式分类问题
二级结构预测的目标:
判断每一段中心的残基是否处于螺旋、折叠、无归卷曲(或其它状态)之一的二级结构态,即三态。 ;基本策略(1)相似序列→相似结构;基本策略(2)分类分析; 2)二级结构预测的参数大体分为三代:
第一代是基于单个氨基酸残基统计分析
从有限的数据集中提取各种残基形成特定二级结构的倾向,以此作为二级结构预测的依据。
第二代预测方法是基于氨基酸片段的统计分析
统计的对象是氨基酸片段
片段体现了中心残基所处的环境
在预测中心残基的二级结构时,以残基在特定环境形成特定二级结构的倾向作为预测依据 ;第一代和第二代参数预测方法对三态预测的准确率一般都小于70%
第三代方法(考虑多条序列,综合算法)
运用长程信息和蛋白质序列的进化信息
准确度有了比较大的提高,一般能上70%。;(1)经验参数法
由Chou 和Fasman在70年代提出来
是一种基于单个氨基酸残基统计的经验预测方法。通过统计分析,获得的每个残基出现于特定二级结构构象的倾向性因子,进而利用这些倾向性因子预测蛋白质的二级结构。
例如:谷氨酸(Glu)主要出现在?螺旋中
天冬氨酸(Asp)和甘氨酸(Gly)主要分布在转角中
脯氨酸(Pro)也常出现在转角中,但是基本不会出现在? 螺旋中;一个氨基酸残基的构象倾向性因子定义为
Pi = Ai / Ti (i= ?,β, t)
式中下标 i 表示构象态
如?螺旋、β折叠、转角等;
Ti 是所有被统计残基处于构象态 i 的比例;
Ai 是第A种残基处于构象态 i 的比例;
Pi 大于1表示该残基倾向于形成二级结构构象i, Pi小于1则表示倾向于形成其它构象。 ;%; 发现关于二级结构的经验规则
基本思想是在序列中寻找规则二级结构的成核位点和终止位点。
扫描输入的氨基酸序列,利用一组规则发现可能成为特定二级结构成核区域的短序列,然后对于成核区域进行扩展,不断扩大成核区域,直到倾向性因子小于1.0为止。
规则:
(i)α螺旋规则
文档评论(0)