蛋白质的β发夹、β（γ）转角及其四类简单超二级结构预测.pdf

下载文档 降价啦

24
0
约 86页
2015-11-29 发布于安徽
举报
版权申诉
保障服务

蛋白质的β发夹、β（γ）转角及其四类简单超二级结构预测.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

蛋白质的∥一发夹、∥()，)一转角及四类简单超二级结构预测摘要由于蛋白质的功能与其结构是密切相关的，因此研究蛋白质的结构是获取功能信息的重要手段。随着人类基因组计划的顺利实施，蛋白质序列信息的积累速度远快于蛋白质结构数据的增长速度。然而，通过实验手段确定蛋白质的结构，不但成本高、耗时，而且实验中还会遇到一些目前无法解决的技术困难，因此人们非常希望能利用理论计算的方法直接从序列信息预测蛋白质结构，这也是生物信息学研究的重要课题。目前，直接从序列信息预测蛋白质的三级结构还很困难。由于局域结构有着较强的序列信号，且在三级结构中大量存在、频繁出现，对蛋白质的折叠、识别和稳定性起重要作用，因此，局域结构的预测可以简化结构预测问题，是蛋白质三级结构预测重要的中间步骤。本文主要研究蛋白质局域结构中超二级结构的预测，重点研究p一发夹模体的预测；研究了部分规N-级结构中p一转角和r转角的预测。 1．提出了一种新的预测算法一基于离散增量的支持向量机算法，用该算法首次对超二级结构数据库(ArchDB40)中D一发夹模体进行了预测，取得较好效果。． 2．利用离散增量和序列打分值构成的向量来表示序列信息，将离散增量和打分值作为向量输入支持向量机，在向量空间中寻找最优超平面，提出了一种新的组合向量 and Acids Bhasin，Nucleic p一发夹数据集和文献(Kumar 已有的p一发夹数据集的预测结果显示，我们的算法可以实现比以往方法更高的预测成功率。与文献中已有数据集的预测结果相比，对独立的检验集预测精度提高4％，p一发夹的敏感性提高6％。论是对5一交叉检验的训练集，还是对独立的检验集都取得较好分类结果。 3．在离散增量和序列打分值的基础上，进一步把预测的二级结构信息加入组合向量，将它们共同输入支持向量机，对普遍使用的，分别包含426个和320个蛋白质序列的两数据集中的部分规则二级结构p．转角和丫．转角进行了预测。结果指出，对p．转角的7．交叉检验预测精度达到79．8％、相关系数为o．47；对丫．转角5一交叉检验预测的相关系数达到了O．18，这些结果都是目前最好的预测结果。 4．建立了一个新的包括2208个非冗余蛋白质链的数据库，蛋白质结构分辨率高构预测，当序列模式固定长取8个氨基酸残基，对“822型”序列模式3．交叉检验的平取10个氨基酸残基，对“1041型”序列模式3．交叉检验的平均预测精度达到83％， Jack-knife检验的平均预测精度达到79．8％。 5．在蛋白质简单超二级结构分类预测、肛发夹预测、p．转角预测及P转角的预测工作中，引入了二肽组分信息参数和亲疏水特征信息参数，改善了预测结果。关键词：局域结构预测，超二级结构模体，p一发夹，p一转角，丫一转角，离散增量，打分矩阵，支持向量机 Kinds Predictionof andFour the∥-Hairpins，∥(力一Turns SimpleSuoer-secondaryyradnoces-repui叁elpmiSsnietorP‘serutcurtS Structuresinroteins Abstract The ofthesnllctLlreofa is tOunderstanditsfunction． knowledge proteinimportant WiththeSuccessofhuman between genomeproject，awideninggapappears rapidly known andslowaccumulationofknown struc