基于Bert+GCN多模态数据融合的药物分子属性预测.pdfVIP

基于Bert+GCN多模态数据融合的药物分子属性预测.pdf

此“医疗卫生”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

TechniquesandMethods技术与方法

生物化学与生物物理进展

ProgressinBiochemistryandBiophysics

2025,52(3):783~794

基于Bert+GCN多模态数据融合的

药物分子属性预测*

1)**1)1)2)**

闫效莺靳艳春冯月华张绍武

1)2)

(西安石油大学计算机学院,西安710065;西北工业大学自动化学院,信息融合教育部重点实验室,西安710072)

摘要目的药物研发成本高、周期长且成功率低。准确预测分子属性对有效筛选药物候选物、优化分子结构具有重要意

义。基于特征工程的传统分子属性预测方法需研究人员具备深厚的学科背景和广泛的专业知识。随着人工智能技术的不断

成熟,涌现出大量优于传统特征工程方法的分子属性预测算法。然而这些算法模型仍然存在标记数据稀缺、泛化性能差等

问题。鉴于此,本文提出一种基于Bert+GCN的多模态数据融合的分子属性预测算法(命名为BGMF),旨在整合药物分子

的多模态数据,并充分利用大量无标记药物分子训练模型学习药物分子的有用信息。方法本文提出了BGMF算法,该算

法根据药物SMILES表达式分别提取了原子序列、分子指纹序列和分子图数据,采用预训练模型Bert和图卷积神经网络

GCN结合的方式进行特征学习,在挖掘药物分子中“单词”全局特征的同时,融合了分子图的局部拓扑特征,从而更充分

利用分子全局-局部上下文语义关系,之后,通过对原子序列和分子指纹序列的双解码器设计加强分子特征表达。结果5个数

据集共43个分子属性预测任务上,BGMF方法的AUC值均优于现有其他方法。此外,本文还构建独立测试数据集验证了模

型具有良好的泛化性能。对生成的分子指纹表征(molecularfingerprintrepresentation)进行t-SNE可视化分析,证明了

BGMF模型可成功捕获不同分子指纹的内在结构与特征。结论通过图卷积神经网络与Bert模型相结合,BGMF将分子图

数据整合到分子指纹恢复和掩蔽原子恢复的任务中,可以有效地捕捉分子指纹的内在结构和特征,进而高效预测药物分子

属性。

关键词Bert预训练,注意力机制,分子指纹,分子属性预测,图卷积神经网络

中图分类号TP391DOI:10.16476/j.pibb.2024.0299CSTR:32369.14.pibb

[6-7][8-9]

利用各种实验方法对分子的属性进行预测,是语言处理、计算机视觉等领域取得突破性

新药发现中的一个重要环节。准确可靠地预测分子进展。

属性,包括物理化学、生物活性以及吸收、分配、简化分子线性输入规范(simplifiedmolecular

代谢、排泄和毒性等,进而寻找具有理想属性的药inputlineentrysystem,SMILES)序列和分子图是

[1]药物分子的两种常见表征方式。其中SMILES序列

物是药学领域的一个长期目标。然而如何对药

物分子进行有效表征是分子属性预测的关键步采用一串ASCII字符描述药物分子的组成和化学结

[2]构。作为一种文本,一系列文本处理算法如卷积神

骤。传统的分子属性预测方法通常是基于专家

手动设计的描述符或分子指纹,如扩展连接指纹经网络(convolutionalneuralnetwork,CNN)和循

(extendedconnectivityfinger

文档评论(0)

新能源知识科普(本账号发布文档均来源于互联网公开资料,仅用于技术分享交流,相关版权为原作者所有。如果侵犯了您的相关权利,请提出指正,我们将立即删除相关资料)。

1亿VIP精品文档

相关文档