一种新的蛋白质结构类预测方法.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种新的蛋白质结构类预测方法.pdf

第 1O卷 第4期 生 物 信 息 学 V0l_10No.4 2012年 12月 ChineseJournalofBioinformatics Dec.,2012 doi:10.3969/j.issn.1672—5565.2012.04.03 一 种新的蛋 白质结构类预测方法 李 楠 ,李 春 (渤海大学数理学院,辽宁 锦州 121000) 摘 要:基于氨基酸的16种分类模型,给出蛋白质序列的派生序列,进而结合加权拟熵和Lz复杂度构造出34维特征向量来 表示蛋白质序列。借助于贝叶斯分类器对同源性不超过25%的640数据集进行蛋 白质结构类预测,准确度达到71.28%。 关键词:蛋 白质结构类预测;氨基酸;加权拟熵;LZ复杂度;贝叶斯分类器 中图分类号:Q71 文献标识码:B 文章编号:1672—5565(2012)一04~238一O3 A new methodforpredictingprotein structuralclasses LINan ,LIChun (CollegeofMathematicsandPhysics,BohaiUniversity,Jinzhou,Liaoning121000) Abstract:Basedon16kindsofclassificationsoftheaminoacids,weobtainthederivedsequencesofaproteinse— quence.CombiningtheweightedpseudoentropywithLempel—Zivcomplexity,weconstructa34一D featurevec— tortorepresentaproteinsequence.ThenitisappliedtopredicttheproteinsturcturalclassesbymensoftheBayes classifier.Thedatasetincludes640sequencesthatsharesequenceidentitybelow25% .Theaccuracyis71.28% . Keywords:Prediction ofprotein sturcturalclasses;Amino acid;Theweightedpseudoentropy;LZ complexity; Bayesclassifier 蛋 白质结构类预测是生物信息学中的一个重要 课题,它的研究不仅对于理解蛋 白质空间折叠机制 1 材料与方法 与蛋白质功能具有理论价值,更对生物制药、农业生 物科技等应用领域具有直接的指导作用。 1.1 数据集 蛋 白质结构分类这一概念是由英国科学家Lev. 本文使用的是640数据集 J。该数据集中的蛋 itt和 Chothia在 1976年提出的_2.3J,他们根据蛋 白 白质序列间同源性不超过25%的,共含有640条序 质序列中二级结构片段的排列和拓扑结构的不同, 列,其中0f2一Ot类 138条,all一 类 154条, 类 将蛋 白质分为四个主要的结构类:(1)all~Ot:主要 177条,+口类 171条。 由Ol螺旋组成;(2)all— :主要 由 折叠组成;(3) 1.2 氨基酸的分类 : 由 螺旋和 折叠交叉混合组成的,其基本单 众所周知,常见氨基酸有20种,其单字母表示 元 中的两个 是相互平行的;(4)O/+ :也是 由 为 C、A、V、I、L、F、P、M、W、C、S、T、N、Q、Y、H、D、E、 螺旋和 折叠混合组成的,但 螺旋处于卢折叠的 K、R。根据文献4【一 ,我们归纳出2O种氨基酸的如 一 端或两端,在其基本单元中的两个 是反平行的。 下 16种分 类 模 型:(1)(AFGILMPVW)(STC— 基于氨基酸

文档评论(0)

开心农场 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档