蛋白质的β发夹、β(γ)转角及其四类简单超二级结构预测.pdf

蛋白质的β发夹、β(γ)转角及其四类简单超二级结构预测.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
蛋白质的∥一发夹、∥(),)一转角及四类简单超二级结构预测 摘要 由于蛋白质的功能与其结构是密切相关的,因此研究蛋白质的结构是获取功能信 息的重要手段。随着人类基因组计划的顺利实施,蛋白质序列信息的积累速度远快于 蛋白质结构数据的增长速度。然而,通过实验手段确定蛋白质的结构,不但成本高、 耗时,而且实验中还会遇到一些目前无法解决的技术困难,因此人们非常希望能利用 理论计算的方法直接从序列信息预测蛋白质结构,这也是生物信息学研究的重要课题。 目前,直接从序列信息预测蛋白质的三级结构还很困难。由于局域结构有着较强 的序列信号,且在三级结构中大量存在、频繁出现,对蛋白质的折叠、识别和稳定性 起重要作用,因此,局域结构的预测可以简化结构预测问题,是蛋白质三级结构预测 重要的中间步骤。 本文主要研究蛋白质局域结构中超二级结构的预测,重点研究p一发夹模体的预 测;研究了部分规N-级结构中p一转角和r转角的预测。 1.提出了一种新的预测算法一基于离散增量的支持向量机算法,用该算法首次对 超二级结构数据库(ArchDB40)中D一发夹模体进行了预测,取得较好效果。. 2.利用离散增量和序列打分值构成的向量来表示序列信息,将离散增量和打分值 作为向量输入支持向量机,在向量空间中寻找最优超平面,提出了一种新的组合向量 and Acids Bhasin,Nucleic p一发夹数据集和文献(Kumar 已有的p一发夹数据集的预测结果显示,我们的算法可以实现比以往方法更高的预测成 功率。与文献中已有数据集的预测结果相比,对独立的检验集预测精度提高4%,p一 发夹的敏感性提高6%。 论是对5一交叉检验的训练集,还是对独立的检验集都取得较好分类结果。 3.在离散增量和序列打分值的基础上,进一步把预测的二级结构信息加入组合向 量,将它们共同输入支持向量机,对普遍使用的,分别包含426个和320个蛋白质序 列的两数据集中的部分规则二级结构p.转角和丫.转角进行了预测。结果指出,对p.转 角的7.交叉检验预测精度达到79.8%、相关系数为o.47;对丫.转角5一交叉检验预测的 相关系数达到了O.18,这些结果都是目前最好的预测结果。 4.建立了一个新的包括2208个非冗余蛋白质链的数据库,蛋白质结构分辨率高 构预测,当序列模式固定长取8个氨基酸残基,对“822型”序列模式3.交叉检验的平 取10个氨基酸残基,对“1041型”序列模式3.交叉检验的平均预测精度达到83%, Jack-knife检验的平均预测精度达到79.8%。 5.在蛋白质简单超二级结构分类预测、肛发夹预测、p.转角预测及P转角的预测 工作中,引入了二肽组分信息参数和亲疏水特征信息参数,改善了预测结果。 关键词:局域结构预测,超二级结构模体,p一发夹,p一转角,丫一转角,离散增量,打 分矩阵,支持向量机 Kinds Predictionof andFour the∥-Hairpins,∥(力一Turns SimpleSuoer-secondaryyradnoces-repui叁elpmiSsnietorP‘serutcurtS Structuresinroteins Abstract The ofthesnllctLlreofa is tOunderstanditsfunction. knowledge proteinimportant WiththeSuccessofhuman between genomeproject,awideninggapappears rapidly known andslowaccumulationofknown struc

您可能关注的文档

文档评论(0)

hblybd123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档