网站大量收购闲置独家精品文档,联系QQ:2885784924

基于LASSO的整合临床和组学特征构建疾病风险预测模型的方法比较及应用.pdf

基于LASSO的整合临床和组学特征构建疾病风险预测模型的方法比较及应用.pdf

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
目 录 中文摘要I 英文摘要 Ⅲ 前 言 1 1 LASSO 方法 4 1.1 LASSO 方法的思想和定义 4 1.2 惩罚调整参数λ的选择 5 2 整合临床和组学的建模方法 6 2.1 Naive-LASSO 法 6 2.2 Separate-LASSO 法 6 2.3 IPF-LASSO 法 6 2.4 Priority-LASSO 法 7 2.5 程序实现 8 3 模拟研究 9 3.1 模拟研究目的 9 3.2 模拟设计 9 3.3 模型评价指标 11 3.4 模拟结果 12 4 实例研究 20 4.1 数据来源和处理 20 4.2 实例分析结果 22 5 讨 论 24 参考文献 26 综 述 31 致 谢 38 个人简介 39 山西医科大学硕士学位论文 基于LASSO 的整合临床和组学特征构建疾病风险预测模型的 方法比较及应用 摘 要 目的: 通过模拟和实例研究对四种基于 LASSO 的可用于整合临床和组学特征构建疾 病风险预测模型的方法——Naive-LASSO 法,Separate-LASSO 法,IPF-LASSO 法 和Priority-LASSO 法的性质进行探讨和比较,为临床建立疾病风险预测模型提供建 议。 方法: 首先,介绍 Naive-LASSO 法,Separate-LASSO 法,IPF-LASSO 法和 Priority-LASSO 法的原理。其次,模拟产生六种稀疏性和变量强度不同的临床和组 学数据,并通过改变协方差矩阵改变各数据内部以及它们之间的相关关系,本研究 考虑以下三种相关关系: (1)临床数据和组学数据内的变量相互独立,两数据间 不相关,协方差矩阵设为单位矩阵; (2 )临床数据和组学数据内的变量呈复合对 称相关,两数据间不相关,协方差矩阵设为块对角矩阵;(3 )临床数据和组学数 据内的变量相关,两数据间也相关,协方差矩阵设置更复杂。通过以上操作共形成 18 种模拟场景,然后使用上述四种方法针对各模拟场景建立预测模型,并通过AUC 、 Brier score 和变量筛选个数对四种方法在不同模拟场景中的表现进行比较。最后, 分别用这四种方法对弥漫大B 细胞淋巴瘤(diffuse large B-cell lymphoma ,DLBCL ) 患者的临床和lncRNA 表达数据进行分析,建立新的DLBCL 预后评价系统,按照 模拟研究的评价标准对各方法在实例中的表现进行评估。 结果: I 山西医科大学硕士学位论文 模拟研究显示,无论在哪一种模拟场景下,四种方法中均是 IPF-LASSO 法和 Priority-LASSO 法表现最好,Separate-LASSO 法所筛变量数最多。其中IPF-LASSO 法的预测准确性比 Priority-LASSO 法还要好一些,它的 AUC 值总高于 Priority-LASSO 法, Brier score 低于Priority-LASSO 法。而且四种方法在满足后两 种相关关系的数据中的预测准确性要高于它们在完全独立的数据中的预测准确性。 但无论临床和组学数据满足何种相关关系,当临床数据的稀疏性和变量强度一定时, 组学数据的稀疏性和变量强度的变化对四种方法的预测表现的影响均不大,但当组 学数据的稀疏性和变量强度一定时,临床数据的稀疏性和变量强度的变化对四种方 法的预测表现的影响均较大。实例研究结果和模拟结果一致,也是IPF-LASSO 法和 Priority-LASSO 法所建的 DLBCL 预后模型的预测准确性较高,且包含的变量个数 较少。而且二者有7 个变量是相同的。 结论:

您可能关注的文档

文档评论(0)

136****6583 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档