基于多信息融合的人类-病毒蛋白质-蛋白质相互作用预测研究.pdfVIP

基于多信息融合的人类-病毒蛋白质-蛋白质相互作用预测研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基于多信息融合的人类-病毒蛋白质-蛋白质相互作用预测

研究

摘要

人类-病毒蛋白质-蛋白质相互作用的预测对于探索病毒感染机制意义重大,

因此预测人类-病毒蛋白质-蛋白质相互作用是一个必要且具有实际价值的研究

课题。由于确定人类-病毒蛋白质-蛋白质相互作用的传统方法非常复杂和昂贵,

因此模型的构建起着至关重要的作用。本文基于多信息融合来研究人类-病毒蛋

白质-蛋白质相互作用,研究内容如下:

1.构建一种基于有效通道注意力机制的可解释性的模型ECA-PHV来预测

人类-病毒蛋白质-蛋白质相互作用。首先,使用氨基酸组成(AAC)、二肽偏离预

期平均值(DDE)、多变量互信息(MMI)、联合三联体(CT)、位置特异性得分矩

阵转移概率组成(GTPC)五种特征提取方法把蛋白质序列转化成数字矩阵,其

次,使用差分进化算法通过加权组合方式获取单个特征权重。然后,使用Group

Lasso去除噪声。之后,通过将BiGRU、一维卷积和有效通道注意力结合来构建

ECA-PHV分类器。最后,将特征向量输入到三个全连接层中,进一步预测人类

蛋白质和病毒蛋白质是否具有相互作用。在训练集TR1和TR2数据集上获得

的ACC值分别为92.21%和92.63%,在TS1和TS2独立测试集上获得的

ACC值分别为86.9%和88.0%。这些结果表明,该模型的预测能力总体上优于

其他分类模型。

2.提出一个基于多信息融合和图注意力网络的模型GAT-PHV,来预测人类

-病毒蛋白质-蛋白质相互作用。首先,通过使用四种特征提取方法:二肽组成(DC)、

二肽偏离预期平均值(DDE)、联合三联体(CT)、多变量互信息(MMI),来挖掘

隐藏在序列中的特征信息,再通过简单串联的方式进行多信息融合。随后,通过

主成分分析去除不相关的特征信息,选择最优特征子集。最后,使用图注意力网

络来预测人类-病毒蛋白质-蛋白质相互作用。其中,图注意力网络是通过K近

邻来构建的。并且图注意力网络采用多头注意力机制,通过多个独立的注意力机

制来学习节点特征,从而使得学习更高效。在五折交叉验证下,本模型在训练集

上ACC值和AUC值分别达到94.15%和0.9812。在独立测试集上,AUC值达到

0.985,其余各项指标也均取得较好的结果。这表明本研究提出的计算框架具有强

大的竞争力和良好的预测性能。

关键词:人类-病毒蛋白质-蛋白质相互作用;多信息融合;深度学习;有效通道

注意力机制;图注意力网络

PREDICTIONSTUGYOFHUMAN-VIRUSPROTEIN-

PROTEININTERACTIONSBASEDONMULTI-

INFORMATIONFUSION

ABSTRACT

Thepredictionofhuman-viralprotein-proteininteractionisofgreatsignificance

forexploringthemechanismofviralinfection,sothepredictionofhuman-viralPPIsis

anecessaryandpracticalresearchtopic.Becausetraditionalmethodsfordetermining

human-viralprotein-proteininteractionsareverycomplexandexpensive,the

constructionofmodelsplaysacrucialrole.Thisthesisisbasedonmulti-information

fusiontostudythehuman-vir

文档评论(0)

营销资料库 + 关注
实名认证
文档贡献者

本账号发布文档部分来源于互联网,仅用于技术分享交流用,版权为原作者所有。 2,文档内容部分来自网络意见,与本账号立场无关。

1亿VIP精品文档

相关文档