基于深度学习的蛋白质二级结构预测.pdfVIP

基于深度学习的蛋白质二级结构预测.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于深度学习的蛋白质二级结构预测.pdf

第32卷 第1期 计 算 机 仿 真 2015年1月 文章编号:1006—9348(2015)01—0392—05 基于深度学习的蛋 白质二级结构预测 张安胜 ,王爱平 , (安徽大学计算机科学与技术学院,安徽 合肥230601) 摘要:后基因组时代的到来,蛋白质的数据量急剧增长。为对蛋白质结构进行准确预测,提出了一种深度学习的方法,来预 测蛋白质的二级结构分类问题。采用由近似熵、疏水模式以及图像特征组成的伪氨基酸组分方法,来提取蛋白质序列的特 征;预测模型采用了5层的深度玻尔兹曼机 (DBM)+分类层 ,5层的DBM组成了4个 RBM,分类层采用 softln~tx分类器;同时 采用了非监督学习和监督学习作为预测模型的训练策略。与现有预测方法相比,提出的预测方法,比目前较好的支持向量 机 (SVM),人工神经网络 (ANN)精度均要高。实验结果表明,提出的改进方法具有很好的可行性和有效性。 关键词:深度学习;蛋白质结构预测;伪氨基酸组分;蛋白质分类 中图分类号:TP302 文献标识码:B PredictionProteinStructureClasswithDeepLearning ZHANG An-sheng,WANG Ai-ping (CollegeofComputerScienceandTechnology,AnhuiUniversity,HeofiAnhui230601,China) ABSTRACT:Withtheadventofthepost-genomeera,theamountofproteindatainthedatabasehasachievedarap· idgrowth.Thepredictionofproteinstructureclassesbecomesmoreimportantforproteinr℃seaI℃h.Inthispaper.we proposedanew methodtopredictproteinstructureclasses,whichwasbasedonthedeeplearning.Intermsoffeature extraction,thePseAA componentswereadoptedonthebasisoftheapproximateentropy,hydrophobicitypattern as wellassomepicturefeatures.ThepredictivemodelhasadoptedaDeepBohzmannMachine(DBM,5-layers)anda classificationlayer,whichbuiltfourRBMs.Theclassificationlayerwasasoftmaxclassifier.Unsupervisedlearning andsupervisedlearningwereadoptedasthetrainingstrategyforpredictivemode1.Comparedwiththecurrentpredic— tionmethods,ouralgorithm ismoreexactthna othermethodssuchasSVM andANN.Theresultshowsthatthepro— posedmethodisviableandeffect. KEYW ORDS:Deeplearning;Proteinstructureprediction;Pseudoaminoacid;Proteinstructuralclass 1 引言 用测试集测试模型的效果。 蛋白质是生命活动的基本单位,其结构决定 了功能,对 蛋白质序列的特征提取常用方法有2种:氨基酸组分 蛋白质结构的研究有助于对其功能的研

文档评论(0)

月光般思恋 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档