基于机器学习算法的心力衰竭10年患病风险可解释预测建模分析.pdfVIP

  • 0
  • 0
  • 约3.29万字
  • 约 8页
  • 2026-02-03 发布于江西
  • 举报

基于机器学习算法的心力衰竭10年患病风险可解释预测建模分析.pdf

中国心血管病研究2024年4月第22卷第4期ChineseJournalofCardiovascularResearch,April2024,Vol.22,No.4

·323·

临床研究临床研究

基于机器学习算法的心力衰竭基于机器学习算法的心力衰竭1010年患病风险年患病风险

可解释预测建模分析可解释预测建模分析

蔡佳音陈海涛王增武

基金项目:国家卫生健康委委托项目(NHC2020-609)

作者单位:102308北京市,中国医学科学院北京协和医学院,阜外医院,国家心血管病中心社区防治部(蔡佳音、王增武);

中山大学公共卫生学院系(深圳)(陈海涛)

【摘要】目的建立基于机器学习算法的心力衰竭10年患病风险预测模型,并通过SHAP方法提升模

型的可解释性,以提高心力衰竭风险评估的准确性和临床应用价值。方法采用英国生物银行(UK

Biobank,UKB)数据库数据,涵盖了40~70岁之间的502349名英国成年人,基于2006~2010年间的基线数据。

选取487572例未发生心力衰竭和10374例发生心力衰竭的病例,随访时间为10年,以ICD-10编码定义心力

衰竭事件。使用LightGBM、XGBoost、CatBoost三种机器学习算法构建预测模型,在Python和RStudio环境

中完成数据预处理、特征选择及模型效能评估,利用SHAP方法可视化解释模型预测结果。结果经过随机

欠采样平衡样本后,本研究建立的模型有效预测了10年内心力衰竭的发病情况。LightGBM模型展现出最

佳的预测性能,其次是CatBoost和XGBoost。SHAP值分析揭示年龄、胱抑素C、接受治疗或服用药物次数、

曾诊断患有心血管疾病、心血管疾病相关多基因风险分数是心力衰竭风险预测的重要影响因素。结论本

研究证实了机器学习模型在心力衰竭风险预测中的有效性,特别是LightGBM模型在所有比较的模型中表

现最佳。SHAP值的分析为理解模型预测的驱动因素提供了新的视角,有助于临床决策支持和风险管理。

【关键词】心力衰竭;风险预测;机器学习;LightGBM;SHAP值

doi:10.3969/j.issn.1672-5301.2024.04.006

中图分类号R541.6文献标识码A文章编号1672-5301(2024)04-0323-08

Machinelearning-basedpredictivemodelingfor10-yearriskofheartfailurewithinterpretability

CAIJia-yin,CHENHai-tao,WANGZeng-wu.DivisionofPreventionandCommunityHealth,NationalCenterfor

CardiovascularDiseases,FuwaiHospital,ChineseAcademyofMedicalSciencesPekingUnionMedical

CollegeChineseAcademyofMedicalSciences,Beijing102308,China(CAIJia-yin,WANGZeng-wu);School

ofPublicHealth,Shenzhen,SunYat-SenUniversity,518107Shenzhen,China(CHENHai-tao)

【Fundprogram】ProjectEntrustedbytheNationalHealthCommissionofthePeoplesRepublicofChina

(NHC2020-609)

【Abstract】ObjectiveTodevelopamachinele

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档