- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
基于机器学习构建肿瘤相关静脉血栓栓塞风险预测
模型的研究进展
【摘要】静脉血栓栓塞症是癌症患者的常见并发症,也是导致癌症患者死亡的常
见原因。机器学习算法为肿瘤相关静脉血栓栓塞(CAT)风险评估提供了新途径。
本文对机器学习算法在CAT风险预测模型的研究进展进行综述,从模型的构建方
法、基本情况和预测性能等方面进行总结、分析和比较,以期为今后CAT风险预
测模型的构建和应用提供借鉴。
【关键词】综述;静脉血栓栓塞症;机器学习;肿瘤;肿瘤相关静脉血栓栓塞症;
风险预测模型
静脉血栓栓塞(venousthromboembolism,VTE),包括深静脉血栓形成(d
eepveinthrombosis,DVT)和肺栓塞,是全球第三大急性心血管综合征[1]。
肿瘤相关静脉血栓栓塞(cancerassociatedthrombosis,CAT)是活动期癌症患
者的常见并发症。据统计,CAT的发生率为4%~20%,约占VTE所有病例的五分
之一[2-3]。癌症患者VTE发病风险比非癌症患者高4~7倍,胰腺癌、胃癌等
实体瘤患者的风险会更高[4-5]。目前,CAT是癌症患者死亡的第二大常见原
因,仅次于癌症进展本身[6-7]。除了增加死亡风险外,CAT还加重了癌症治
疗过程的负担。研究表明,在抗凝治疗期间癌症患者经历更高的VTE复发率和出
血并发症[8-9]。CAT的发生发展不仅延长癌症患者住院时间,降低患者生活
质量,还可能导致中断或停止抗癌治疗[10]。因此,尽早识别CAT风险并对其
进行针对性的预防措施尤为重要。目前,肿瘤患者中广泛应用的VTE风险评估模
型包括Caprini模型、Khorana模型、COMPASSCAT模型等,但这些模型在VTE
风险分层上的精确度却并不理想[11]。随着大数据、人工智能和精准医学的蓬
勃发展,以机器学习为主的新型算法在VTE风险预测方面崭露头角。机器学习是
人工智能的分支和主要实现方法,其本质是模型的选择和模型参数的确定[12]。
机器学习可在海量医学数据中自动学习经验,识别多维数据间复杂的非线性关系
并建模,从而进行疾病风险、不良事件风险等方面的智能预测和决策[13]。本
文通过对国内外CAT领域中采用机器学习算法构建风险预测模型的相关研究进
行综述,从模型的构建方法、基本情况和预测性能等方面对相关研究进行总结、
分析和比较,以期为今后CAT风险预测模型的构建和应用提供借鉴。
一、基于机器学习算法构建CAT风险预测模型的研究现状
基于机器学习算法构建CAT风险预测模型的基本流程为:数据收集(对历史
数据预处理以形成数据集)、数据划分(将数据集分为训练集和测试集)、模型
构建(模型选择后进行训练和测试,并进行参数优化)、模型应用(最优模型应
用验证)。目前,被用于CAT风险评估研究的几种主要机器学习模型包括逻辑回
归、随机森林、支持向量机、极限梯度提升和线性判别分析等。
1.预测CAT的逻辑回归模型:逻辑回归模型是一种解决分类问题的概率模型,
可根据给定的自变量数据集估计事件的发生概率[14]。逻辑回归模型具有简单
易行、可解释强的优点,在医疗领域预测模型研究中广泛应用。
国外利用逻辑回归模型进行CAT风险预测的研究起步较早。早在1998年,M
eier和Jick[15]使用逻辑回归算法构建了使用他莫昔芬治疗乳腺癌患者的特
2
发性VTE风险预测模型,并发现体重指数≥30kg/m是VTE的独立危险因素。虽
然我国CAT风险预测模型研究起步较晚,但发展迅速。目前,我国学者基于逻辑
回归算法已开发了肺癌[16]、结直肠癌[17]、头颈癌[18]等实体瘤患者的
CAT风险预测模型,均取得了较好的预测效果。
Chen等[19]回顾性收集791例实体瘤患者的临床资料,构建CAT风险预
测列线图模型。通过单因素和多因素Logistic回归分析识别出8个独立危险因
素:年龄≥60岁、癌症类型、肿瘤Ⅲ~Ⅳ期、血小板体积分布宽度≤12.6%,白
蛋白浓度≤38.8g/L、乳酸脱氢酶浓度≥198U/L,D-二聚体浓度≥1.72μg/ml、
血红蛋白浓度≤100g/dl。该模型内部验证受试者工作特征(receiveroperati
ngcharacteristic,ROC)的曲线下面积(areaunderthecurve,AUC)为0.
文档评论(0)