- 1、本文档共84页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
基于Transformer的蛋白质间相互作用预测方法研究
摘要
蛋白质间相互作用研究是目前生物信息学的重要研究方向,有助于揭示生化活动的
运作机制,帮助人类理解生命的本质规律,且对于疾病机理的解析、新药的研发具有重
大意义。为了实现准确、快速的蛋白质间相互作用预测,深度学习方法正逐渐被应用。
深度学习模型预测所采用的蛋白质数据通常包括蛋白质一级序列信息以及三级结构信
息。本文基于这些信息展开研究。
首先,构建出本研究所使用的种内数据集以及多物种数据集。种内数据集分为人类
数据与酵母数据两类,是对多个已有数据集进行收集、验证、筛选后整合而成的。多物
种数据集则是对SKEMPIv2.0数据库进行筛选并通过Rosetta软件进行突变PDB计算
后汇总而成。对于所有数据集,都进行了相关预处理,为后续实验做准备。
随后,仅采用蛋白质序列信息,本文设计了一种基于Transformer架构的深度学习
模型STPPI。首先分别对两个蛋白质序列的氨基酸进行位置编码,并经由门控卷积网络
生成序列信息的特征表达,然后运用自注意力机制以及编码器-解码器注意力机制生成
两个蛋白质的序列特征,最后,融合两个序列特征,实现相互作用预测。所设计模型在
各项评价指标上都相较同类型模型有所提升,且表现出很好的种内泛化能力。
最后,进一步设计了一种有效融合蛋白质序列特征及三级结构特征来实现蛋白互作
预测的深度学习模型GTPPI。模型的序列特征提取模块仍然采用STPPI的整体架构。三
级结构特征提取模块则使用图神经网络对蛋白质图进行解构与编码,并引入Transformer
自注意力机制实现图神经网络中节点信息的更新,获取整张图的特征表达。最后,通过
可学习参数有机结合序列特征与三级结构特征,实现蛋白互作预测。GTPPI模型展现出
了比其他基于序列的方法更高的预测性能,同时,引入三级结构的方式也有效提升了模
型的跨物种泛化能力。
关键词:蛋白质间相互作用;序列信息;三级结构信息;Transformer
基于Transformer的蛋白质间相互作用预测方法研究
Abstract
Protein-proteininteractionresearchiscurrentlyacrucialdirectioninbioinformatics,
aidinginunveilingthemechanismsofbiochemicalactivities.Italsohelpshumanityunderstand
thefundamentallawsoflife,andhassignificantimplicationsfordiseasemechanismanalysis
andnewdrugdevelopment.Toachieveaccurateandrapidpredictionsofprotein-protein
interactions,deeplearningmethodsareincreasinglybeingapplied.Theproteindatatypically
usedindeeplearningmodelpredictionsincludesprimarysequenceinformationandtertiary
structureinformation.Thispaperconductsresearchbasedonthesepiecesofinformation.
Initially,anintraspeciesdatasetandamultispeciesdatasetwereconstructedforuseinthis
study.Theintraspeciesdatasetisdividedintohumanandyeastdata,whichareintegrated
collectionsfrommultipleexistingdatasets
您可能关注的文档
- LiCl-KCl熔盐中镧系Gd)离子浓度在线监测研究.pdf
- Mg和Li含量对Al-Mg学性能和腐蚀性能的影响研究.pdf
- MXene改性PEDOT_及在微生物燃料电池中的应用.pdf
- Ni_3Al基合金热变形行及高温CO_2腐蚀渗碳研究.pdf
- 玻璃微珠_空心球壳增强树脂复合材料制备及吸水特性研究.pdf
- 超声辅助激光熔化沉积Ti6金的微观组织与力学性能研究.pdf
- 堆芯燃料组件域CFD高效计处理分析与精细流动特性研究.pdf
- 还原氧化石墨烯_聚苯胺_镍)复合电极的电化学性能研究.pdf
- CAR-T细胞免疫疗法中细征关联细胞因子分析及其预测.pdf
- CF_PEEK热塑性复合材开孔性能及低速冲击性能研究.pdf
- 2024年07月汉中市中心医院招聘笔试历年专业考点(难、易错点荟萃)附带答案详解 .doc
- 2024年05月内蒙古鄂尔多斯市鄂托克旗卫生健康委员会所属事业单位招聘150人笔试历年专业考点(难、易错点荟萃)附带答案详解 .doc
- 2024年05月江西省妇幼保健院招聘2名硕士研究生人才(39)笔试历年专业考点(难、易错点荟萃)附带答案详解 .doc
- 2024年05月广东珠海市金湾区疾病预防控制中心招聘合同制职员6人笔试历年专业考点(难、易错点荟萃)附带答案详解 .doc
- 2024年05月上海市奉贤区卫生健康系统第二轮招聘事业单位编外医技专业采样人员116人笔试历年专业考点(难、易错点荟萃)附带答案详解 .doc
- 2024年05月年江苏扬州市蜀冈瘦西湖风景名胜区卫生系统招聘编外检验员10人笔试历年专业考点(难、易错点荟萃)附带答案详解 .doc
- 2024年05月浙江温州市医疗保障局公开招聘编外聘用人员2人笔试历年专业考点(难、易错点荟萃)附带答案详解 .doc
- 2025年中国耐高压灰管大位移伸缩器市场调查研究报告.docx
- 2025至2030年中国吡啶甲酸锌数据监测研究报告.docx
- 2025至2030年中国冷阴极霓虹灯管数据监测研究报告.docx
文档评论(0)