- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
?
?
使用生物信息学方法建立模型对肝癌免疫治疗效果进行预测
?
?
谭沪生任敏
摘要:目的:探讨治疗使用生信方法对肝癌免疫治疗进行指导。方法:在tcga数据库下载数据,使用R语言进行分析。结果:使用模型构建的低风险评分患者对抗PD-L1与抗CTLA4治疗敏感性较高。结论:模型可以对抗PD-L1以及抗CLT4治疗在肝癌患者中的应用效果起到预测作用。
关键词:生物信息学;肝癌;免疫治疗;预后分析
R735.7????????????A????????????2107-2306(2021)15--01
肝癌是人类常见的恶性肿瘤之一。没有疗效确切的辅助治疗手段。抗PD-1单克隆抗体,在多项癌症治疗中,都扮演了化腐朽为神奇的角色。但因为高额的负担,使肝癌患者在未有正面的预期情况下,难以下决心使用。本文使用TCGA数据库下载的数据建立模型,预测肝脏恶性肿瘤患者对于抗PD-1单克隆抗体的敏感性,探索抗PD-1单克隆抗体在于肝癌的应用。
1方法
1.1数据下载与分析
在tcga数据库下载数据。计算肿瘤组和正常组的基因表达量标准差,进行差异分析,得到在肿瘤样品和正常组织样品中表达有区别的差异基因(p0.05),对数据进行校正后保存。通过immport数据库,找到免疫相关基因,对免疫基因与得到的差异基因进行取交集,得到差异的免疫基因。
1.2预后模型建立
对差异免疫基因的表达数据和临床数据中的生存时间数据进行合并,排除随访时间小于30天的样本。对差异的免疫基因进行生存分析,找到与预后相关的免疫基因。用这些与预后相关的免疫基因,构建预后模型。将所有的样本数据分组,得到train和test组(2:1),对分组的各项临床性状使用卡方检验。用train组的数据来构建模型,用test组的数据来验证模型的准确性。预测模型风险得分=每个样品中,所有与预后相关的免疫基因的表达量*风险系数后求总和。取train组风险打分的中位值,大于中位值为高风险组,小于中位值为低风险组。同样的在test组中,风险得分大于train组中位值为高风先祖,小于中位值为低风险组。
1.3风险系数(coef)的确定
对train进行单因素cox分析,如果P值小于0.05,则说明该基因是预后相关基因,保留,反之则剔除。对留下的单因素显著基因及其表达量进行lasso回归,构建lasso模型,剔除相关性过高的基因,防止模型的过度拟合,并找到交叉验证误差最小的点,得到各基因的风险系数。
1.4生存分析与ROC分析
对高低风险组进行生存分析,查看是否有高低风险的患者生存曲线是否有差异。查看ROC曲线下面积,推测模型准确率。
1.5独立预后分析
将风险得分与其他临床特征分别与生存时间和生存状态做关联,若P0.05,则认为为独立预后相关。再做多因素独立预后分析,若P0.05,则認为独立于其他临床因素,与患者的预后相关。
1.6免疫治疗分析
对于高低风险组的病人,哪一组更适合免疫治疗。在tcia数据库下载肝癌患者的免疫打分文件,与研究的全部患者取交集,按照高低风险分组,分别求得高低风险组的免疫打分,做差异分析,得到高低风险的免疫打分对比。
2结果
2.1样本与免疫基因数量
TCGA下载数据总共465份样本。其中正常样品数量:58;肿瘤样品数量:407。可以得到相对正常细胞在肿瘤细胞中高表达和低表达的差异基因。将肿瘤样品和正常样品中区别表达的这些差异基因与immport数据库下载的免疫基因取交集后,总共得到343个差异的免疫基因。
2.2模型构建
2.2.1模型构建
lasso回归数据见图,剔除过度拟合基因后,可以得到预测模型,用我们的模型对test组和总样本进行的生存分析结果为:1.train组的生存分析,可见高低风险组之间存在差异(p0.05);2.用模型对test组进行验证,可见高低风险组之间的生存分析存在差异(p0.05);3.train组的AUC面积为0.782;4.test组的AUC面积为0.782;高低风险组之间的生存数据存在明显差异,验证了我们的模型预测价值。Roc曲线下面积train组、test组、总样本均大于0.5,检测方法真实性良好。
Fig2:a.lasso回归模型;b.对lasso模型进行交叉验证,找到误差最小点,所对应的基因即为lasso回归显著基因,从而得到预测模型。
2.2.2患者预后相关基因的单因素COX分析与多因素cox分析结果
患者单因素与多因素cox结果得到,我们的风险打分能够独立的预测患者的预后(P小于0.01)。
2.3免疫治疗相关基因分析结果
高低风险组之间CD274(PDL1基因)表达量差异P小于0.05,存在统计学差异。与tcia下载的免疫打分文件合并后,得到高低风险组之间的免疫打分,进行统计学比较,结果如图,可以得到结果:我们的预测模型预
文档评论(0)