1. 1、本文档共74页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
13第六章.ppt

第六章 利用蛋白质序列进行预测的方法 第一节 概述 第二节 蛋白质辩识 PepMAPPER 第三节 对序列的物理性质进行计算 PeptideMass(ExPASy) SAPS giref|NP_004976.2| c-K-ras2 protein isoform b precursor [Homo sapiens] MTEYKLVVVGAGGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQVVIDGETCLLDILDTAGQEEYSAMRDQ YMRTGEGFLCVFAINNTKSFEDIHHYREQIKRVKDSEDVPMVLVGNKCDLPSRTVDTKQAQDLARSYGIP FIETSAKTRQGVDDAFYTLVREIRKHKEKMSKDGKKKKKKSKTKCVIM 第四节 二级结构和折叠类型 nnpredict PredictProtein SOPMA 各种方法的比较 用户可提供一段原序列,也可提供SWISS-PROT标识,如果是后者,PeptideMass工具还能利用SWISS-PROT库中的信息进行改进计算:除去信号序列、在剪切之前引入已知的翻译后的修饰等。然后用户在“Select an enzyme”一项中选择想要的酶,点击perform 键即完成查询。 PeptideMass工具将输出的结果列成表格,其中包括输入蛋白的pI理论值和分子量,SWISS-PROT库中相关变种的分子量、位点、修饰后的分子量和信息,肽片段的序列。 SAPS(Statistical Analysisi of Protein Sequence)是瑞士实验癌症研究院的生物信息研究小组提供的蛋白质序列统计分析方法,用于给出关于查询序列的广泛统计信息。 用户可将查询蛋白序列通过Web界面提交给SAPS服务器,服务器通过对查询序列本身的分析给出该蛋白的物理化学性质的信息,如各种氨基酸组成含量、整个序列电荷分布、正负电荷聚集区的分析、高疏水性区域和跨膜区段、重复序列、周期性等。 蛋白质的二级结构是指蛋白质分子中某一段肽链的局部空间结构。主要为α-螺旋(α-helix)、β-折叠(β-pleated sheet)、β转角(β-turn)、无规则弯曲(random coil)。在许多蛋白质分子中,可发现二个或三个具有二级结构的肽段,在空间上相互接近,形成一个具有特殊功能的空间结构,称为基序(motif)。一个基序总有其特征性的氨基酸序列,并发挥特殊的功能。 一级结构是二级结构的基础,有时蛋白质分子中起关键作用的氨基酸残基缺失或被替代,都会严重影响空间构象乃至生理功能,如由蛋白质分子发生变异产生的“分子病”。研究蛋白质的二级结构对蛋白质空间结构的确定、设计合理的生物化学实验有重要意义。 有关已知蛋白质性质和结构的有关信息可以到SWISS-PROT或PHD数据库中查找。对新发现的蛋白质或未知功能的基因产物进行分析,首先用BLAST或其他工具在公共数据库中进行相似性搜索,寻找相匹配的蛋白质,但很多时候无法找到匹配蛋白质,有时虽然找到一个统计显著的匹配蛋白质,序列记录中也没有有关其二级结构的信息。 利用二级结构和折叠类型的预算工具可以预测出序列折叠成α螺旋和β折叠的能力,可能存在的基序以及功能结构域。 同核酸序列预测程序一样,在蛋白质二级结构预测中许多计算程序采取了“神经网络”技术,即给计算过程赋予类似人的学习能力,使用了数据库中的已知数据作为训练集。有关的二级结构的计算程序有很多,其中有商用软件,也有在线提供的免费软件,有些仅限用于UNIX机上。如果不是大量序列分析,使用再线工具就够了。ExPASy上的protemics tools提供了许多二级结构预测工具,这里只介绍nnpredict、PredictProtein和SOPMA三种计算工具。 nnpredict算法使用了一个双层、前馈神经网络,计算每个氨基酸分配的类型。用户使用时非常简单,可以直接登陆nnpredict网页(/~nomi/nnpredict.html)或通过ExPASy页面上的protemics tools链接或发送电子邮件将查询序列提交给nnpredict。(nnpredoct@), 每个电子邮件只能提交一个序列。 nnpredict服务器使用FASTA格式文件,用户只需将查询序列帖在箱内,按SUBMIT键即完成查询。图6.10是nnpredict的输入页面。 nnpredict的输出结果包括用单字符或三字符表示的序列、蛋白质的折叠类型(α,β或α/β)。残基的预测结果中:“H”表示α螺旋、“E”表示β折叠、“T”表示转角、“-”为无规则弯曲。如果某个残基未给出预测,在该残基的位置上则会标上问号“?”,

文档评论(0)

rewfdgd + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档