CN116189785B 基于空间转录组学数据特征提取的空间域识别方法 (西安电子科技大学).docxVIP

CN116189785B 基于空间转录组学数据特征提取的空间域识别方法 (西安电子科技大学).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN116189785B(45)授权公告日2025.07.01

(21)申请号202310097081.0

(22)申请日2023.02.10

(65)同一申请的已公布的文献号申请公布号CN116189785A

(43)申请公布日2023.05.30

(73)专利权人西安电子科技大学

地址710071陕西省西安市太白南路2号

(72)发明人贾松卫崔议文兰猛

(74)专利代理机构陕西电子工业专利中心

61205

专利代理师王品华

(51)Int.CI.

G16B40/20(2019.01)

G16B25/00(2019.01)

GO6F18/2135(2023.01)

GO6F18/23(2023.01)

(56)对比文件

CN112766062A,2021.05.07

CN115359845A,2022.11.18审查员来文燕

权利要求书6页说明书11页附图2页

(54)发明名称

基于空间转录组学数据特征提取的空间域识别方法

(57)摘要

CN116189785B本发明公开了一种基于空间转录组学数据特征提取的空间域识别方法,主要解决现有技术对空间转录组数据特征提取存在过拟合及空间域识别精度低的问题。其实现方案为:对空间转录组中测量得到的基因表达数据和空间信息进行预处理;基于基因表达特征矩阵和空间信息构建基因相似性网络和空间邻域网络;对基因相似性网络和空间邻域网络进行数据增强;构建特征提取模型,并将增强的数据输入到模型中计算对比损失和重构损失;依据计算损失训练模型,将未增强的数据输入到训练好的模型中得到低维嵌入;对低维嵌入进行聚类完成对空间域识别。本发明避免了在特征提取过程中的过拟合,提高

CN116189785B

开始

开始

获得空间转录组数据

数据预处理

构建基因表达相似性网络

数据增强

构建空间转录组数据特

征提取模型

将数据依次输入模型进行训练

得到包含空间信息和基因表达的低维胀入

使用Leiden算法对低维嵌入进行聚类

结束

构建空间邻域网络

数据增强

CN116189785B权利要求书1/6页

2

1.一种基于空间转录组学数据特征提取的空间域识别方法,其特征在于,包括如下步

骤:

(1)使用空间转录组测序技术对所需组织切片中每一个像素点同时测量其基因表达值和空间位置坐标,得到包含像素点-基因表达矩阵和组织切片中每个像素点空间位置的空间转录组数据;

(2)对空间转录组数据的基因表达矩阵进行预处理:

(2a)删除空间转录组数据中基因表达值少于三个像素点的表达基因;

(2b)对删除后的数据进行数值归一化,使得各个细胞的计数和为所有细胞的中位数,再对归一化后的数据进行对数转换,并将其标准化为零均值和单位方差;

(2c)对标准化后的数据进行主成分分析PCA,提取前n个主成分,生成基因表达的特征矩阵X;

(3)构建空间邻域网络:

(3a)基于空间坐标信息计算组织切片中每个像素点之间在空间位置上的欧式距离d:

(3b)基于空间坐标计算的欧式距离d选取每个像素点的前k个最近邻,构建表征空间信息的邻接矩阵A;

(3c)将步骤(2)生成的基因表达特征矩阵X作为节点属性特征矩阵;

(3d)基于表征空间信息的邻接矩阵A和节点属性特征矩阵X,构成空间邻域网络G?(A,X);

(4)构建基因表达相似性网络:

(4a)基于步骤(2)生成的基因表达特征矩阵X,计算组织切片中每个像素点基因表达值之间的欧式距离d′;

(4b)基于基因表达值计算的欧式距d′,选取每个像素点的前k个最近邻,构建表征基因表达相似性的邻接矩阵B;

(4c)基于表征基因表达相似性的邻接矩阵B和节点属性特征矩阵X,构成基因表达相似性网络G?(B,X);

(5)数据增强:

(5a)对空间邻居网络中的边和节点属性特征依照符合伯努利分布的给定边遮掩概率p和节点特征遮掩概率p进行遮掩,得到增强后的空间邻居网络G?(A?,X?);

(5b)对基因表达相似性网络中的边和节点属性特征依照符合伯努利分布的给定边遮

掩概率p′和节点特征遮掩概率p′进行遮掩,得到增强后基因表达相似性网络G?(B?,X?);

(6)构建由编码器f(·)分别与解码器h(·)和投影器g(·)级联组成的空间转录组数据的特征提取模型,并使用对

您可能关注的文档

文档评论(0)

xm + 关注
实名认证
文档贡献者

专业学习资料,专业文档

1亿VIP精品文档

相关文档