- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
空间表达变异基因识别方法及其在肿瘤异质性研究中的应用进展
关双刘溪王博王念刘骏王忠
[摘要]?空间表达变异基因的识别是阐明空间转录组学的基础。空间表达变异基因的分析需应用空间转录组数据相关公共存储库和计算技术。本文综述空间转录组学应用于空间表达变异基因识别的计算方法,阐述空间表达变异基因识别在肿瘤异质性研究中的应用进展,以进一步理解驱动肿瘤异质性发生发展的分子机制。
[关键词]?空间转录组学;空间表达变异基因;肿瘤异质性
[中图分类号]?R730????[文献标识码]?A????[DOI]?10.3969/j.issn.1673-9701.2024.02.027
人体组织由各种类型的细胞组成,每种类型的细胞均执行特定的功能,而细胞行为受组织内周围环境的影响。了解组织中不同细胞的相对位置对于理解细胞类型和疾病机制至关重要[1]。肿瘤的空间异质性不仅由基因型的多样性驱动,还由肿瘤细胞与构成局部肿瘤微环境的免疫和基质细胞之间的相互作用产生,从而导致肿瘤的不同区域具有独特表型,因此了解肿瘤的空间异质性在临床上有重要意义[2-3]。
1??空间表达变异基因的鉴定
1.1??Trendsceek
Trendsceek利用标记点过程理论,以空间位置为点、表达水平为标记,应用标记点过程对每个基因的空间表达趋势重要性进行排序和评估[10]。该方法通过将点作为其距离半径函数進行成对分析,测试点的空间分布及其相关标记之间的相关性。用于依赖性评估的汇总统计量包括条件均值、条件方差、Stoyan分数相关性和分数-变异函数。
1.2??SpatialDE
SpatialDE利用高斯过程回归将基因表达变化分解为空间成分和非空间成分[11]。空间差异项通过样本的成对距离将基因表达协方差参数化,噪声项模拟非空间可变性。由上述分量解释的方差比率量化空间方差的分数。通过将上述完整模型与无空间方差分量的模型进行比较,可对空间表达变异基因进行识别。
1.3??Spark
1.4??Spark-X
Spark-X建立在稳定的协方差测试框架基础上,并将其扩展为结合各种空间核,用于对来自大型空间转录研究的稀疏计数数据进行非参数空间建模[13]。对于给定的基因,Spark-X首先构建基因表达的协方差矩阵(Y)和空间坐标的协方差矩阵(S),然后计算测试统计量(T)。测试统计量T实际上是所有位置对上的两个相似性测量之间的乘积总和。当Y和S彼此独立时,位置对之间关于基因表达的相似性度量将不会与位置对之间关于距离的相似性度量相关。因此,T值较小。
1.5??GPCounts
GPCounts建模具有负二项可能性的时间或空间计数数据[14]。使用具有对数连接函数的GP模拟计数数据分布在时间或空间平均值的变化。对于空间转录数据,GPCounts遵循两个测试程序,使用根据χ2分布估计的P值,还可通过置换测试估计P值。GPcounts可识别执行伪时间推断,识别分支基因并发现时间轨迹[15]。与大多数软件包相比,GPcounts的应用范围更广。但该方法在应用于大型数据集时,其计算效率并不明确。
2??空间域的识别
识别空间特征是空间转录组学分析中的步骤之一。为识别组织结构,现有算法对转录组上相似位点或细胞进行分组,以揭示基因表达的空间模式。较新方法可专职利用空间数据识别组织特征,如组织域。在空间表达变异基因检测中考虑空间域可确保检测到的基因在空间域中表现为丰富的表达模式,这些基因可作为细胞空间位置的标志物[16-17]。
2.1??SpaGCN
SpaGCN是一种利用图卷积网络分析ST数据,划分不同组织区域并寻找区域富集基因的机器学习算法[18]。首先,建图表示考虑空间位置和组织学信息所有点的关系;其次,利用图卷积层聚合来自相邻点基因的表达信息;第三,使用无监督迭代聚类算法对点进行聚类。每个集群视为一个空间域,SpaGCN通过差异分析识别区域中富集的空间表达变异基因。当单个基因无法标记一个区域的表达模式时,SpaGCN会构建一个由多个基因组合形成的元基因,从而代表该区域的表达模式。SpaGCN的重点是结合现有组织学确定空间域,并确定在空间域之间存在的差异表达基因。在计算空间表达变异基因时,SpaGCN未将细胞类型信息和组织解剖结构纳入计算中。
2.2??SOMDE
SOMDE使用自组织映射,在保持原始空间信息的前提下,根据输入数据的密度和拓扑结构构造一个节点数较少的压缩映射,应用高斯过程检测空间表达变异基因[19]。SOMDE的核心思想是构造一种精简的空间转录数据整合策略,既可保留空间表达变异基因的信息,又可降低下游的计算复杂度。该方法即使在非常大的数据集中也能有效识别空间表达变异基因,且运行速度快。
2.3??MULTILAYER
MULTILAYER将每个基因的差异表达水平与整
文档评论(0)