CN118969065B 一种药物-蛋白质结合亲和力预测方法 (重庆邮电大学).docxVIP

  • 2
  • 0
  • 约1.14万字
  • 约 19页
  • 2026-01-18 发布于重庆
  • 举报

CN118969065B 一种药物-蛋白质结合亲和力预测方法 (重庆邮电大学).docx

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN118969065B(45)授权公告日2025.07.04

(21)申请号202411158582.6

(22)申请日2024.08.22

(65)同一申请的已公布的文献号申请公布号CN118969065A

(43)申请公布日2024.11.15

(73)专利权人重庆邮电大学

地址400065重庆市南岸区南山街道崇文

路2号

(72)发明人万厚源刘文裕吴思奇刘彬

(74)专利代理机构重庆辉腾律师事务所50215专利代理师卢胜斌

(51)Int.CI.

G16B15/30(2019.01)

GO6N3/0464(2023.01)

GO6N3/0442(2023.01)

GO6N3/045(2023.01)

G16B40/00(2019.01)

GO6N3/048(2023.01)

(56)对比文件

CN117423378A,2024.01.19

CN118173161A,2024.06.11审查员余祖浩

权利要求书2页说明书6页附图2页

(54)发明名称

一种药物-蛋白质结合亲和力预测方法

(57)摘要

CN118966065B本发明属于数据挖掘技术领域,具体涉及一种药物-蛋白质结合亲和力预测方法,包括:获取多模态的药物-蛋白质数据,将其输入训练好的亲和力预测模型,得到预测值;所述亲和力预测模型的训练过程包括:获取多模态的药物-蛋白质数据,将其输入特征提取模块,得到多模态的药物-蛋白质特征;将多模态的药物-蛋白质特征进行拼接,得到初始综合特征表示;将初始综合特征表示输入应用记忆模块的动态注意力模块,得到最终的综合特征;将最终的综合特征输入预测模块,得到预测结果;根据预测结果计算损失函数值,根据损失函数值更新模型参数;本发明通过注意力权重记忆机制利用历史注意力权重

CN118966065B

获取多模态的药物-蛋白质数据,将多模态的药物-

蛋白质数据输入特征提取模块,得到多模态的药物-蛋白质特征

将多模态的药物-蛋白质特征进行拼接,得到初始综合特征表示

将初始综合特征表示输入应用记忆模块的动态注意力模块,得到最终的综合特征

将最终的综合特征输入预测模块,得到预测结果

根据预测结果计算损失函数值,根据损失函数值更新模型参数,当损失函数值最小时,得到训练好的亲和力预测模型

CN118969065B权利要求书1/2页

2

1.一种药物-蛋白质结合亲和力预测方法,其特征在于,包括:获取多模态的药物-蛋白质数据,将多模态的药物-蛋白质数据输入训练好的亲和力预测模型,得到药物-蛋白质亲和力的预测值;所述亲和力预测模型包括:特征提取模块、应用记忆模块的动态注意力模块以及预测模块;所述亲和力预测模型的训练过程包括:

S1:获取多模态的药物-蛋白质数据,将多模态的药物-蛋白质数据输入特征提取模块,得到多模态的药物-蛋白质特征;

S2:将多模态的药物-蛋白质特征进行拼接,得到初始综合特征表示;

S3:将初始综合特征表示输入应用记忆模块的动态注意力模块,得到最终的综合特征;

S4:将最终的综合特征输入预测模块,得到预测结果;

S5:根据预测结果计算损失函数值,根据损失函数值更新模型参数,当损失函数值最小时,得到训练好的亲和力预测模型;

所述多模态的药物-蛋白质数据包括:药物的SMILES字符串、药物的分子图结构以及蛋白质的氨基酸序列;

特征提取模块包括:SMILES特征提取模块、分子图结构特征提取模块以及氨基酸序列特征提取模块;

SMILES特征提取模块包括:嵌入层、一维卷积神经网络以及LSTM网络;SMILES特征提取模块对药物的SMILES字符串进行处理包括:将SMILES字符串转换为整数编码;将整数编码后的SMILES字符串输入嵌入层,得到嵌入矩阵;将嵌入矩阵输入一维卷积神经网络,得到局部特征;将局部特征输入LSTM网络,得到SMILES字符串特征;

分子图结构特征提取模块对药物的分子图结构进行处理包括:将药物的分子图结构表示为一个分子无向图G=(V,E),其中,V为节点集合,节点表示分子图结构的原子,E为边集合,边表示分子图结构的化学键;初始化每个节点和每条边的特征向量;利用图卷积网络对分子无向图G中节点和边的特征向量进行处理,得到分子图结构特征;

氨基酸序列特征提取模块包括:嵌入层、一维卷

文档评论(0)

1亿VIP精品文档

相关文档