网站大量收购独家精品文档,联系QQ:2885784924

基于Transformer白质间相互作用预测方法研究.pdf

基于Transformer白质间相互作用预测方法研究.pdf

  1. 1、本文档共84页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

基于Transformer的蛋白质间相互作用预测方法研究

摘要

蛋白质间相互作用研究是目前生物信息学的重要研究方向,有助于揭示生化活动的

运作机制,帮助人类理解生命的本质规律,且对于疾病机理的解析、新药的研发具有重

大意义。为了实现准确、快速的蛋白质间相互作用预测,深度学习方法正逐渐被应用。

深度学习模型预测所采用的蛋白质数据通常包括蛋白质一级序列信息以及三级结构信

息。本文基于这些信息展开研究。

首先,构建出本研究所使用的种内数据集以及多物种数据集。种内数据集分为人类

数据与酵母数据两类,是对多个已有数据集进行收集、验证、筛选后整合而成的。多物

种数据集则是对SKEMPIv2.0数据库进行筛选并通过Rosetta软件进行突变PDB计算

后汇总而成。对于所有数据集,都进行了相关预处理,为后续实验做准备。

随后,仅采用蛋白质序列信息,本文设计了一种基于Transformer架构的深度学习

模型STPPI。首先分别对两个蛋白质序列的氨基酸进行位置编码,并经由门控卷积网络

生成序列信息的特征表达,然后运用自注意力机制以及编码器-解码器注意力机制生成

两个蛋白质的序列特征,最后,融合两个序列特征,实现相互作用预测。所设计模型在

各项评价指标上都相较同类型模型有所提升,且表现出很好的种内泛化能力。

最后,进一步设计了一种有效融合蛋白质序列特征及三级结构特征来实现蛋白互作

预测的深度学习模型GTPPI。模型的序列特征提取模块仍然采用STPPI的整体架构。三

级结构特征提取模块则使用图神经网络对蛋白质图进行解构与编码,并引入Transformer

自注意力机制实现图神经网络中节点信息的更新,获取整张图的特征表达。最后,通过

可学习参数有机结合序列特征与三级结构特征,实现蛋白互作预测。GTPPI模型展现出

了比其他基于序列的方法更高的预测性能,同时,引入三级结构的方式也有效提升了模

型的跨物种泛化能力。

关键词:蛋白质间相互作用;序列信息;三级结构信息;Transformer

基于Transformer的蛋白质间相互作用预测方法研究

Abstract

Protein-proteininteractionresearchiscurrentlyacrucialdirectioninbioinformatics,

aidinginunveilingthemechanismsofbiochemicalactivities.Italsohelpshumanityunderstand

thefundamentallawsoflife,andhassignificantimplicationsfordiseasemechanismanalysis

andnewdrugdevelopment.Toachieveaccurateandrapidpredictionsofprotein-protein

interactions,deeplearningmethodsareincreasinglybeingapplied.Theproteindatatypically

usedindeeplearningmodelpredictionsincludesprimarysequenceinformationandtertiary

structureinformation.Thispaperconductsresearchbasedonthesepiecesofinformation.

Initially,anintraspeciesdatasetandamultispeciesdatasetwereconstructedforuseinthis

study.Theintraspeciesdatasetisdividedintohumanandyeastdata,whichareintegrated

collectionsfrommultipleexistingdatasets

您可能关注的文档

文档评论(0)

n1u。 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档