CN115171780B 基于自注意力机制的长链非编码rna-疾病关联预测方法和系统 (四川大学).docxVIP

  • 0
  • 0
  • 约1.58万字
  • 约 28页
  • 2026-01-12 发布于重庆
  • 举报

CN115171780B 基于自注意力机制的长链非编码rna-疾病关联预测方法和系统 (四川大学).docx

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN115171780B(45)授权公告日2025.07.01

(21)申请号202210818621.5

(22)申请日2022.07.12

(65)同一申请的已公布的文献号申请公布号CN115171780A

(43)申请公布日2022.10.11

(73)专利权人四川大学

地址610065四川省成都市武侯区一环路

南一段24号

(72)发明人朱敏周怡王心翌姚林

(74)专利代理机构成都禾创知家知识产权代理有限公司51284

专利代理师刘凯

(51)Int.CI.

G16B20/30(2019.01)

G16B40/00(2019.01)

GO6N3/045(2023.01)

GO6N3/084(2023.01)

(56)对比文件

YiZhou等.LDAformer:predicting

lncRNA-diseaseassociationsbasedon

topologicalfeatureextractionand

TransformerencoderFree.《Briefingsin

Bioinformatics》.2022,第23卷(第6期),1-12.

周怡.基于异质图学习的miRNA-疾病关联预测研究.《万方数据》.2025,1-98.

王心翌.基于自注意力机制的RNA-蛋白质相

互作用预测研究.《中国优秀硕士学位论文全文数据库基础科学辑》.2025,(第01期),A006-

225.

审查员朱原雨润

权利要求书4页说明书9页附图2页

(54)发明名称

基于自注意力机制的长链非编码RNA-疾病关联预测方法和系统

(57)摘要

CN115171780B本发明公开了一种基于自注意力机制的长链非编码RNA-疾病关联预测方法和系统,使用已经经过生物实验验证的长链非编码RNA-疾病关联数据来训练深度学习模型,并使用所述模型预测目标长链非编码RNA-疾病节点对的关联关系;在特征提取阶段,本发明基于已知关联和相似性信息构建异质网络的带权邻接矩阵,并进一步提取其中的多跳拓扑通路特征;在模型阶段,本发明使用自注意力机制构建预测模型,赋予关键拓扑通路更高的权重以使网络充分学习关键特征,进而提升模型的预测精度;最后,在基准数据集

CN115171780B

预测长链非编码RNA疾病关联关系

Sigmoid分类器

层归一化

报基道接前馈神经网络

报基道接

层归一化

我差进接多头自注意力

我差进接

拓扑特征提取

带权邻接矩阵

长链非编码RNA疾病关联数据

CN115171780B权利要求书1/4页

2

1.一种基于自注意力机制的长链非编码RNA-疾病关联预测方法,其特征在于,包括如下步骤:

S1:数据获取与预处理:获取疾病语义信息和已知的长链非编码RNA-疾病关联情况,构建异质网络,并计算同质节点彼此间的相似性;

S2:拓扑特征提取:将所述相似性和关联情况表示为异质网络的带权邻接矩阵,根据所述邻接矩阵幂次的定义,获取目标长链非编码RNA-疾病节点对之间的多跳拓扑通路特征;

S3:基于自注意力网络预测关联关系:构建基于自注意力机制的神经网络,获取特征嵌入并通过单层全连接网络进行分类,将基于自注意力机制的神经网络的输出矩阵转换为概率分布,预测是否具有关联关系;

S4:模型训练:在训练集上基于反向传播算法进行模型训练,得到长链非编码RNA-疾病关联预测模型;

S5:预测关联关系:通过预测模型处理目标长链非编码RNA-疾病节点对,判断是否具有关联关系。

2.根据权利要求1所述的基于自注意力机制的长链非编码RNA-疾病关联预测方法,其特征在于,所述步骤S1具体为:

S11:整合长链非编码RNA-疾病关联关系:

对于1个长链非编码RNA和d种疾病,以A∈R1×表示其关联关系;若已知某长链非编码RNA-疾病节点对有关联,则ALp中的对应位置值为1,否则值为0;

S12:计算疾病相似性:

获取疾病之间的父子关系并将其表示为有向无环图;对于疾病t?,记T?是包含了t?及其祖先疾病的集合,则T?中的任一疾病t相对于t?的语义贡献值为:

其中,childrenoft指疾病t的子疾病集合;

设SV(t?)=teT?St?(t),SV

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档