基于类别不平衡与机器学习方法的弥漫大B细胞淋巴瘤患者复发风险预测模型研究.pdfVIP

基于类别不平衡与机器学习方法的弥漫大B细胞淋巴瘤患者复发风险预测模型研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
目 录 摘 要I AbstractIII 常用缩写词中英文对照表V 前 言6 1.DLBCL患者复发风险预测模型研究现状6 2.构建准确率较高、适用性较强的DLBCL患者复发风险模型7 2.1提升模型准确率7 2.2 提升模型适用性10 第一部分 建模方案性能图谱12 1对象与方法12 1.1 对象12 1.2 方法13 2 结 果20 2.1分类模型20 2.2 概率模型31 第二部分 实例应用41 1 对象与方法41 1.1 对象41 1.2 方法42 2 结 果43 2.1 变量筛选结果43 2.2 采用五种备选方案构建DLBCL 患者复发风险预测模型46 讨论53 结论57 参考文献57 综述62 参考文献69 附录72 致谢112 个人简介113 山西医科大学硕士学位论文 基于类别不平衡与机器学习方法的弥漫大B细胞淋巴瘤 患者复发风险预测模型研究 摘 要 目的: B DLBCL 弥漫性大 细胞淋巴瘤 ( )是最常见的非霍奇金淋巴瘤,目前主要使用 R-CHOP 30% 50% 作为标准化疗方案,但仍有 到 的患者因耐药复发。患者复发后因 缺乏有效的治疗方案生存率较低,能准确预测患者的复发风险并提供有效的巩固化 疗方案已成为临床医生亟待解决的重要问题。其中疾病成因错综复杂、数据中的类 别不平衡问题均导致现有模型分类性能较弱、适用患者有限等问题,故本研究旨在 使用机器学习方法构建准确率较高、适用性较强的DLBCL 患者复发风险预测模型, 为临床治疗方案制定提供参考。 方法: 9 2 logistic 为提升模型准确率,联合 种类别平衡方法、 种机器学习方法、 回归 4 48 方法与 种集成学习方法形成共 种建模方案。为提升模型适用性,首先使用以上 12 方案分别 个存在类别不平衡问题的公共数据库构建分类与概率预测模型,对后者 采用Platt scaling进行概率校准;其次评价模型性能并绘制随着数据类别不平衡率变 化建模方案性能变化图谱;随后应用图谱为经变量筛选后的DLBCL 患者达到完全 5 缓解后的复发数据库挑选 套备选建模方案建模;最后选取其中模型性能评价指标 最高者作为患者两年、三年与五年内复发风险分类与概率预测模型。 结果: 1 Adaboost ()根据模拟研究中对联合集成学习 ( 同型集成,随机森林,平均 Stacking SMOTE RACOG DBSM 投票和 异型集成等四种方法)、重采样 ( , , 和 FCMSMT 9 C5.0 等四种方法)和代价敏感等三大类共 种类别平衡方法、 决策树与 I 山西医科大学硕士学位论文 支持向量机等两种机器学习方法、传统logistic 回归方法与4 种集成学习方法形成共 48种建模方案绘制的图谱,其中使用未平衡数据、使用SMOTE

您可能关注的文档

文档评论(0)

136****6583 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档