- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种新的蛋白质结构类预测方法.pdf
第 1O卷 第4期 生 物 信 息 学 V0l_10No.4
2012年 12月 ChineseJournalofBioinformatics Dec.,2012
doi:10.3969/j.issn.1672—5565.2012.04.03
一 种新的蛋 白质结构类预测方法
李 楠 ,李 春
(渤海大学数理学院,辽宁 锦州 121000)
摘 要:基于氨基酸的16种分类模型,给出蛋白质序列的派生序列,进而结合加权拟熵和Lz复杂度构造出34维特征向量来
表示蛋白质序列。借助于贝叶斯分类器对同源性不超过25%的640数据集进行蛋 白质结构类预测,准确度达到71.28%。
关键词:蛋 白质结构类预测;氨基酸;加权拟熵;LZ复杂度;贝叶斯分类器
中图分类号:Q71 文献标识码:B 文章编号:1672—5565(2012)一04~238一O3
A new methodforpredictingprotein structuralclasses
LINan ,LIChun
(CollegeofMathematicsandPhysics,BohaiUniversity,Jinzhou,Liaoning121000)
Abstract:Basedon16kindsofclassificationsoftheaminoacids,weobtainthederivedsequencesofaproteinse—
quence.CombiningtheweightedpseudoentropywithLempel—Zivcomplexity,weconstructa34一D featurevec—
tortorepresentaproteinsequence.ThenitisappliedtopredicttheproteinsturcturalclassesbymensoftheBayes
classifier.Thedatasetincludes640sequencesthatsharesequenceidentitybelow25% .Theaccuracyis71.28% .
Keywords:Prediction ofprotein sturcturalclasses;Amino acid;Theweightedpseudoentropy;LZ complexity;
Bayesclassifier
蛋 白质结构类预测是生物信息学中的一个重要
课题,它的研究不仅对于理解蛋 白质空间折叠机制 1 材料与方法
与蛋白质功能具有理论价值,更对生物制药、农业生
物科技等应用领域具有直接的指导作用。 1.1 数据集
蛋 白质结构分类这一概念是由英国科学家Lev. 本文使用的是640数据集 J。该数据集中的蛋
itt和 Chothia在 1976年提出的_2.3J,他们根据蛋 白 白质序列间同源性不超过25%的,共含有640条序
质序列中二级结构片段的排列和拓扑结构的不同, 列,其中0f2一Ot类 138条,all一 类 154条, 类
将蛋 白质分为四个主要的结构类:(1)all~Ot:主要 177条,+口类 171条。
由Ol螺旋组成;(2)all— :主要 由 折叠组成;(3) 1.2 氨基酸的分类
: 由 螺旋和 折叠交叉混合组成的,其基本单 众所周知,常见氨基酸有20种,其单字母表示
元 中的两个 是相互平行的;(4)O/+ :也是 由 为 C、A、V、I、L、F、P、M、W、C、S、T、N、Q、Y、H、D、E、
螺旋和 折叠混合组成的,但 螺旋处于卢折叠的 K、R。根据文献4【一 ,我们归纳出2O种氨基酸的如
一 端或两端,在其基本单元中的两个 是反平行的。 下 16种分 类 模 型:(1)(AFGILMPVW)(STC—
基于氨基酸
您可能关注的文档
最近下载
- GB50709-2011 钢铁企业管道支架设计规范.pdf VIP
- 压力性损伤护理与管理能力提升题库答案-2025年华医网继续教育.docx VIP
- 基因多态性与疾病易感性-洞察及研究.docx VIP
- 三位一体煅烧炉生产无水氟化铝工艺说明 .pdf VIP
- 卵巢囊肿蒂扭转急诊护理查房.pptx VIP
- 《中华人民共和国国歌》PPT课件.ppt VIP
- 2025年航空货运行业市场规模及未来五到十年发展趋势报告.docx
- 初中八年级全套体育教案(共36课).docx VIP
- 50045 GBJ45-82 高层民用建筑设计防火规范.pdf VIP
- 股市主力操盘盘 口摩斯密码(原创内容,侵权必究).pptx
文档评论(0)