基于ceRNA机制的乳腺癌预后生物标志物识别.pdfVIP

  • 7
  • 0
  • 约9.14万字
  • 约 73页
  • 2023-02-10 发布于江苏
  • 举报

基于ceRNA机制的乳腺癌预后生物标志物识别.pdf

基于ceRNA 机制乳腺癌预后生物标志物识别 摘要 越来越多的证据强调了差异表达基因作为竞争性内源性RNA (ceRNA )在 肿瘤发展和进展中的作用。尽管如此,仍然缺乏能够预测乳腺癌(BC )预后的 ceRNA 网络中的关键生物标志物研究。基于差异基因互作对的ceRNA 网络构建 方法,不仅缩小了目标基因的研究范围,另一方面也为评估乳腺癌患者的预后提 供了关键潜在生物标志物,这将有助于我们增加对参与乳腺癌早期发展的 ceRNA 机制的理解。本文研究的目的是基于ceRNA 机制筛选出的差异表达基因, 确定能够预测乳腺癌患者总生存期 (OS )的潜在基因并构建相应的能够预测患 者预后风险的模型。 在本研究中,首先从 TCGA 数据库下载的乳腺癌 Count 表达谱数据,按照 乳腺癌组织和癌旁组织进行分组,获取lncRNA 、mRNA 和miRNA 的表达谱数 据和临床数据,并对RNA 测序数据进行差异基因分析。基于差异基因互作对构 建了一个乳腺癌相关的失调 ceRNA 网络并使用 Cytoscape 软件可视化。接着对 ceRNA 网络中差异mRNA 进行 GO 和 KEGG 富集分析,获得其功能及相关通 路。综合分析了在乳腺癌变过程中具有一定影响的mRNA 以及这些生物标志物 可能的作用机制。为进一步探究,对该ceRNA 网络进行生存分析,根据Kaplan- Meier 和对数秩检验得到乳腺癌相关的关键DEmRNA 和DEmiRNA 与总生存期 (OS )存在相关性,与乳腺癌患者的OS 显著相关(p 0.05) 。采用单因素 Cox 比例风险回归模型对TCGA-BRCA 队列中CeRNA 网络节点lncRNA ,miRNA 以 及mRNA 进行分析。针对单因素Cox 回归中P0.05 的关键基因及TCGA-BRCA 队列样本进一步进行Lasso 回归分析。建立风险评分公式,由此对训练集TCGA- BRCA 队列进行风险评分,根据StepMiner 二分法选取风险评分截断值,把患者 划分为高、低风险两组。分别对验证集 (GSE20685 )中的高、低风险组都进行 Kaplan-Meier 分析。绘制ROC 曲线对模型的效能进行检验。最后,对关键基因 标志物模型与其他临床变量的独立性进行检验,将TCGA-BRCA 队列中保留有 全面预后信息的样本进行Cox 单因素和多因素分析。 通过对乳腺癌 Count 表达谱数据进行差异基因分析,共筛选出差异表达的 167 条lncRNA (107 个上调和60 个下调),169 条miRNA (96 个上调和73 个下 调)和 1831 条mRNA (620 个上调和 1211 个下调)。根据差异基因间的互作关 系,使用Cytoscape 绘制出一个由131 条lncRNA ,11 条miRNA 和131 条mRNA 组成的乳腺癌相关ceRNA 调控网络。功能富集分析结果显示差异表达mRNA 主 要富集在与免疫相关的通路上。根据 Kaplan-Meier 和对数秩检验得到乳腺癌中 1 摘要 共有 5 种关键 DEmRNA 和 3 个关键 DEmiRNA 与总生存期(OS )显著相关 (P0.05 )。采用单因素 Cox 比例风险回归得到 7 个与乳腺癌预后相关的基因 TP63、BACH2 、LIFR 、TBC1D4、AK3 、TCF7L2、CACNA2D1 。Lasso 回归分析 显示当变量数为6 时,模型均方根偏差相对较小,于是可建立一个6-基因的乳腺 癌预后预测风险评分模型:risk score=(-0.062)* TP63 表达值+(-0.035)* LIFR 表达 值+(-0.060)* TBC1D4 表达值+(-0.0170)* AK3 表达值+(-0.078)* TCF7L2 表达值 +(-0.059)* CACNA2D1 表达值。生存分析显示,高风险组与低风险组相比,高风 险组中OS 偏小的患者多,而低风险组的生存率

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档