- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
基于机器学习构建肿瘤相关静脉血栓栓塞风险预测
模型的研究进展
【摘要】静脉血栓栓塞症是癌症患者的常见并发症,也是导致癌症患者死亡的常
见原因。机器学习算法为肿瘤相关静脉血栓栓塞(CAT)风险评估提供了新途径。
本文对机器学习算法在CAT风险预测模型的研究进展进行综述,从模型的构建方
法、基本情况和预测性能等方面进行总结、分析和比较,以期为今后CAT风险预
测模型的构建和应提供借鉴。
【关键词】综述;静脉血栓栓塞症;机器学习;肿瘤;肿瘤相关静脉血栓栓塞症;
风险预测模型
静脉血栓栓塞(venousthromboembolism,VTE),包括深静脉血栓形成(d
eepveinthrombosis,DVT)和肺栓塞,是全球第三大急性心血管综合征[1]。
肿瘤相关静脉血栓栓塞(cancerassociatedthrombosis,CAT)是活动期癌症患
者的常见并发症。据统计,CAT的发生率为4%〜20%,约占VTE所有病例的五分
之一[2-]。癌症患者VTE发病风险比非癌症患者高4〜7倍,胰腺癌、胃癌等
实体瘤患者的风险会更高[4-5]。目前,CAT是癌症患者死亡的第二大常见原
因,仅次于癌症进展本身[6-7]o除了增加死亡风险外,CAT还加重了癌症治
疗过程的负担。研究表明,在抗凝治疗期间癌症患者经历更高的VTE复发率和出
血并发症[8-9]oCAT的发生发展不仅延长癌症患者住院时间,降低患者生活
质量,还可能导致中断或停止抗癌治疗[10]。因此,尽早识别CAT风险并对其
进行针对性的预防措施尤为重要。目前,肿瘤患者中广泛应的VTE风险评估模
型包括Caprini模型、Khorana模型、COMPASSCAT模型等,但这些模型在VTE
风险分层上的精确度却并不理想[11]O随着大数据、人工智能和精准医学的蓬
勃发展,以机器学习为主的新型算法在VTE风险预测方面崭露头角。机器学习是
人工智能的分支和主要实现方法,其本质是模型的选择和模型参数的确定[12]。
机器学习可在海量医学数据中自动学习经验,识别多维数据间复杂的非线性关系
并建模,从而进行疾病风险、不良事件风险等方面的智能预测和决策[1]。本
文通过对国内外CAT领域中采机器学习算法构建风险预测模型的相关研究进
行综述,从模型的构建方法、基本情况和预测性能等方面对相关研究进行总结、
分析和比较,以期为今后CAT风险预测模型的构建和应提供借鉴。
一、基于机器学习算法构建CAT风险预测模型的研究现状
基于机器学习算法构建CAT风险预测模型的基本流程为:数据收集(对历史
数据预处理以形成数据集)、数据划分(将数据集分为训练集和测试集)、模型
构建(模型选择后进行训练和测试,并进行参数优化)、模型应(最优模型应
验证)。目前,被于CAT风险评估研究的几种主要机器学习模型包括逻辑回
归、随机森林、支持向量机、极限梯度提升和线性判别分析等。
1.预测CAT的逻辑回归模型:逻辑回归模型是一种解决分类问题的概率模型,
可根据给定的自变量数据集估计事件的发生概率[14]。逻辑回归模型具有简单
易行、可解释强的优点,在医疗领域预测模型研究中广泛应。
国外利逻辑回归模型进行CAT风险预测的研究起步较早。早在1998年,M
eier和Jick[15]使逻辑回归算法构建了使他莫昔芬治疗乳腺癌患者的特
发性VTE风险预测模型,并发现体重指数^0kg/m2是VTE的独立危险因素。虽
然我国CAT风险预测模型研究起步较晚,但发展迅速。目前,我国学者基于逻辑
回归算法已开发了肺癌[16]、结直肠癌[17]、头颈癌[18]等实体瘤患者的
CAT风险预测模型,均取得了较好的预测效果。
Chen等[19]回顾性收集791例实体瘤患者的临床资料,构建CAT风险预
测列线图模型。通过单因素和多因素Logistic回归分析识别出8个独立危险因
素:年龄N60岁、癌症类型、肿瘤III-IV期、血小板体积分布宽度<12.6%,白
蛋白浓度<8.8g/L.乳酸脱氢酶浓度N198U/L,D-二聚体浓度N1.72ug/ml、
血红蛋白浓度<100g/dlo该模型内部验证受试者工作特征(receiveroperati
ngcharacteristic,ROC)的曲线下面积(areaunderthecurve,AUC)为0.
852,C
您可能关注的文档
- 泰安新泰市鸡蛋价格的波动实证探究9700字论文 .docx
- 宜宾职业技术学院单招《英语》考试参考题及答案 .pdf
- 互联网金融课程结课论文:互联网金融背景下小微企业融资困境与对策研究6500字 .pdf
- 全国地理教师赛课一等奖人教版七年级地理上册(人教2024年)《气温的变化与分布》教学设计 .pdf
- 部编版高中历史上册第三单元《走向整体的世界》测试题(含答案) .pdf
- 【2024】苏教版科学五年级上册每课教学反思(带目录) .docx
- 2025年全国健康管理师理论考试题库(含答案) .pdf
- 二年级道德与法治下册第九课小水滴的诉说教学设计第二课时 .pdf
- 2024教科版科学小学四年级上册知识点梳理归纳 .pdf
- 部编版七年级语文下册第四单元第17课《短文两篇—爱莲说》测试题(含答案) .pdf
文档评论(0)