CN119811510B 一种单细胞Hi-C数据增强方法、系统及存储介质 (中山大学).docxVIP

CN119811510B 一种单细胞Hi-C数据增强方法、系统及存储介质 (中山大学).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN119811510B(45)授权公告日2025.07.01

(21)申请号202510293942.1

(22)申请日2025.03.13

(65)同一申请的已公布的文献号申请公布号CN119811510A

(43)申请公布日2025.04.11

(73)专利权人中山大学

地址510275广东省广州市海珠区新港西

路135号

(72)发明人田德朝张淇乔张悦高文静

(74)专利代理机构广州市华学知识产权代理有限公司44245

专利代理师林梅繁

(51)Int.CI.

G16B40/30(2019.01)

G16B40/00(2019.01)

GO6F18/25(2023.01)

GO6F18/23(2023.01)

GO6N3/042(2023.01)

GO6N3/045(2023.01)

GO6N3/0464(2023.01)

GO6N3/0455(2023.01)

(56)对比文件

CN113628112A,2021.11.09

liuT等.cHiCEmbed:Bin-Specific

EmbeddingsofSingle-CellHi-CDataUsingGraphAuto-Encoders.《Genes》.2022,第13卷第1-19页.

审查员温冰冰

权利要求书5页说明书14页附图1页

(54)发明名称

一种单细胞Hi-C数据增强方法、系统及存储介质

(57)摘要

CN119811510B本发明涉及生物信息学技术,为一种单细胞Hi-C数据增强方法、系统及存储介质。其方法包括步骤:对多分辨率的Hi-C数据进行预处理,提取不同分辨率下的Hi-C接触矩阵并构建为图结构,得到不同分辨率下的图结构数据;构建变分图自编码器VGAE模型作为融合单元模型,将所述图结构数据输入融合单元模型,进行特征提取与矩阵重构,实现不同分辨率下的图结构数据的跨尺度融合,获得不同分辨率下的融合潜在空间特征,重构接触矩阵作为增强后的Hi-C接触矩阵。本发明将低分辨率与高分辨率数据的信息进行有效融合,解决了单细胞

CN119811510B

题。

S1

S1

对多分辨率的Hi-C数据进行预处理,得到不同分辨率下的图结构数据

S2

构建变分图自编码器VGAE模型作为融合单元模型,对不同分辨率下的图结构进行特征提取与矩阵重构,将重构接触矩阵作为增强后的Hi-C接触矩阵

S3

通过增强后的Hi-C接触矩阵,识别Hi-C数据中的结构域边界

CN119811510B权利要求书1/5页

2

1.一种单细胞Hi-C数据增强方法,其特征在于,包括以下步骤:

S1、对多分辨率的Hi-C数据进行预处理,提取每个细胞不同分辨率下的Hi-C接触矩阵,将不同分辨率下的Hi-C接触矩阵构建为图结构,得到不同分辨率下的图结构数据;

S2、构建变分图自编码器VGAE模型作为融合单元模型,将不同分辨率下的图结构数据输入融合单元模型,进行特征提取与矩阵重构,实现不同分辨率下的图结构数据的跨尺度融合,获得不同分辨率下的融合潜在空间特征,重构接触矩阵作为增强后的Hi-C接触矩阵;

步骤S2包括:

S21、设计变分图自编码器VGAE模型作为融合单元模型;

S22、设置VGAE模型的编码器,同时输入多分辨率的图结构数据使VGAE模型学习每个分辨率下的图结构节点特征,并通过图卷积操作提取潜在的结构信息;再将不同分辨率下的图结构节点特征进行维度变换,对多个分辨率的图结构节点特征进行加强融合,输出不同分辨率下的融合潜在空间特征;

S23、设置VGAE模型的解码器,根据编码器输出的不同分辨率下的融合潜在空间特征,通过矩阵的内积操作计算图结构的节点之间的相似性,以重构生成不同分辨率下的Hi-C接触矩阵的预测值,得到预测接触矩阵;

S24、基于重构损失与KL散度损失,构建VGAE模型的损失函数,用于优化融合单元模型的训练过程;其中,重构损失用于衡量原始接触矩阵和预测接触矩阵之间的差异,KL散度损失用于衡量编码器输出的潜在空间特征分布与标准正态分布之间的差异;

重构损失为:

其中LBCE为重构损失,N表示接触矩阵中元素的总数;Aij为原始Hi-C接触矩阵的元

素,表示节点i

文档评论(0)

aabbcc + 关注
实名认证
文档贡献者

若下载文档格式有问题,请咨询qq1643702686索取原版

1亿VIP精品文档

相关文档