蛋白质的预测方法.pdfVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蛋白质的预测方法.pdf

针对蛋白质的预测方法 传统的生物学认为,蛋白质的序列决定了它的三维结构,也就决定了它的功能。 由于用X光晶体衍射和NMR核磁共振技术测定蛋白质的三维结构,以及用生化方 法研究蛋白质的功能效率不高,无法适应蛋白质序列数量飞速增长的需要,因此 近几十年来许多科学家致力于研究用理论计算的方法预测蛋白质的三维结构和 功能,经过多年努力取得了一定的成果。 1. 从氨基酸组成辨识蛋白质 根据组成蛋白质的20种氨基酸的物理和化学性质可以分析电泳等实验中的未知 蛋白质,也可以分析已知蛋白质的物化性质。ExPASy工具包中提供了一系列相 应程序: AACompIdent:根据氨基酸组成辨识蛋白质。这个程序需要的信息包括:氨基酸 组成、蛋白质的名称(在结果中有用)、pI和Mw(如果已知)以及它们的估算误差、 所属物种或物种种类或“全部(ALL)”、标准蛋白的氨基酸组成、标准蛋白的 SWISS-PROT编号、用户的Email地址等,其中一些信息可以没有。这个程序在 SWISS-PROT和(或)TrEMBL数据库中搜索组成相似蛋白。 AACompSim:与前者类似,但比较在SWISS-PROT条目之间进行。这个程序可以用 于发现蛋白质之间较弱的相似关系。 除了ExPASy中的工具外,PROPSEARCH也提供基于氨基酸组成的蛋白质辨识功能。 程序作者用144种不同的物化性质来分析蛋白质,包括分子量、巨大残基的含量、 平均疏水性、平均电荷等,把查询序列的这些属性构成的“查询向量”与 SWISS-PROT和PIR中预先计算好的各个已知蛋白质的属性向量进行比较。这个 工具能有效的发现同一蛋白质家族的成员。可以通过Web使用这个工具,用户只 需输入查询序列本身。 ExPASy的网址是:http://www.expasy.ch/tools/。 PROSEARCH的网址是:http://www.embl-heidelberg.de/prs.html。 2. 预测蛋白质的物理性质 从蛋白质序列出发,可以预测出蛋白质的许多物理性质,包括等电点、分子量、 酶切特性、疏水性、电荷分布等。相关工具有: Compute pI/MW:是ExPASy工 具包中的程序,计算蛋白质的等电点和分子量。对于碱性蛋白质,计算出的等电 点可能不准确。 PeptideMass:是ExPASy工具包中的程序,分析蛋白质在各种 蛋白酶和化学试剂处理后的内切产物。蛋白酶和化学试剂包括胰蛋白酶、糜蛋白 酶、LysC、溴化氰、ArgC、AspN和GluC等。 TGREASE:是FASTA工具包中的程序,分析蛋白质序列的疏水性。这个程序延序 列计算每个残基位点的移动平均疏水性,并给出疏水性-序列曲线,用这个程序 可以发现膜蛋白的跨膜区和高疏水性区的明显相关性。 SAPS:蛋白质序列统计 分析,对提交的序列给出大量全面的分析数据,包括氨基酸组成统计、电荷分布 分析、电荷聚集区域、高度疏水区域、跨膜区段等等。 ExPASy的网址是:http://www.expasy.ch/tools/。 下载FASTA的网址是:/pub/fasta/。 SAPS的网址是:http://www.isrec.isb-sib.ch/software/SAPS_form.html。 3. 蛋白质二级结构预测 二级结构是指α螺旋和β折叠等规则的蛋白质局部结构元件。不同的氨基酸残 基对于形成不同的二级结构元件具有不同的倾向性。按蛋白质中二级结构的成分 可以把球形蛋白分为全α蛋白、全β蛋白、α+β蛋白和α/β蛋白等四个 折叠类型。预测蛋白质二级结构的算法大多以已知三维结构和二级结构的蛋白质 为依据,用过人工神经网络、遗传算法等技术构建预测方法。还有将多种预测方 法结合起来,获得“一致序列”。总的来说,二级结构预测仍是未能完全解决的 问题,一般对于α螺旋预测精度较好,对β折叠差些,而对除α螺旋和β折 叠等之外的无规则二级结构则效果很差。 (自己可以用不同的软件解决) nnPredict:用神经网络方法预测二级结构,蛋白质结构类型分为全α蛋白、全 β蛋白和α/β蛋白,输出结果包括“H”(螺旋)、“E”(折叠)和“-”(转角)。 这个方法对全α蛋白能达到79%的准确率。 PredictProtein:提供了序列搜索和结构预测服务。它先在SWISS-PROT中搜索 相似序列,用MaxHom算法构建多序列比对的profile,再在数据库中搜索相似 的profile,然后用一套PHD程序来预测相应的结构特征,包括二级结构。返回 的结果包含大量预测过程中产生的信息,还包含每

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档