- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
目 录
中文摘要I
英文摘要 Ⅲ
前 言 1
1 LASSO 方法 4
1.1 LASSO 方法的思想和定义 4
1.2 惩罚调整参数λ的选择 5
2 整合临床和组学的建模方法 6
2.1 Naive-LASSO 法 6
2.2 Separate-LASSO 法 6
2.3 IPF-LASSO 法 6
2.4 Priority-LASSO 法 7
2.5 程序实现 8
3 模拟研究 9
3.1 模拟研究目的 9
3.2 模拟设计 9
3.3 模型评价指标 11
3.4 模拟结果 12
4 实例研究 20
4.1 数据来源和处理 20
4.2 实例分析结果 22
5 讨 论 24
参考文献 26
综 述 31
致 谢 38
个人简介 39
山西医科大学硕士学位论文
基于LASSO 的整合临床和组学特征构建疾病风险预测模型的
方法比较及应用
摘 要
目的:
通过模拟和实例研究对四种基于 LASSO 的可用于整合临床和组学特征构建疾
病风险预测模型的方法——Naive-LASSO 法,Separate-LASSO 法,IPF-LASSO 法
和Priority-LASSO 法的性质进行探讨和比较,为临床建立疾病风险预测模型提供建
议。
方法:
首先,介绍 Naive-LASSO 法,Separate-LASSO 法,IPF-LASSO 法和
Priority-LASSO 法的原理。其次,模拟产生六种稀疏性和变量强度不同的临床和组
学数据,并通过改变协方差矩阵改变各数据内部以及它们之间的相关关系,本研究
考虑以下三种相关关系: (1)临床数据和组学数据内的变量相互独立,两数据间
不相关,协方差矩阵设为单位矩阵; (2 )临床数据和组学数据内的变量呈复合对
称相关,两数据间不相关,协方差矩阵设为块对角矩阵;(3 )临床数据和组学数
据内的变量相关,两数据间也相关,协方差矩阵设置更复杂。通过以上操作共形成
18 种模拟场景,然后使用上述四种方法针对各模拟场景建立预测模型,并通过AUC 、
Brier score 和变量筛选个数对四种方法在不同模拟场景中的表现进行比较。最后,
分别用这四种方法对弥漫大B 细胞淋巴瘤(diffuse large B-cell lymphoma ,DLBCL )
患者的临床和lncRNA 表达数据进行分析,建立新的DLBCL 预后评价系统,按照
模拟研究的评价标准对各方法在实例中的表现进行评估。
结果:
I
山西医科大学硕士学位论文
模拟研究显示,无论在哪一种模拟场景下,四种方法中均是 IPF-LASSO 法和
Priority-LASSO 法表现最好,Separate-LASSO 法所筛变量数最多。其中IPF-LASSO
法的预测准确性比 Priority-LASSO 法还要好一些,它的 AUC 值总高于
Priority-LASSO 法, Brier score 低于Priority-LASSO 法。而且四种方法在满足后两
种相关关系的数据中的预测准确性要高于它们在完全独立的数据中的预测准确性。
但无论临床和组学数据满足何种相关关系,当临床数据的稀疏性和变量强度一定时,
组学数据的稀疏性和变量强度的变化对四种方法的预测表现的影响均不大,但当组
学数据的稀疏性和变量强度一定时,临床数据的稀疏性和变量强度的变化对四种方
法的预测表现的影响均较大。实例研究结果和模拟结果一致,也是IPF-LASSO 法和
Priority-LASSO 法所建的 DLBCL 预后模型的预测准确性较高,且包含的变量个数
较少。而且二者有7 个变量是相同的。
结论:
您可能关注的文档
- 红细胞分布宽度和纤维蛋白原联合检测与慢性阻塞性肺疾病严重程度相关性的研究.pdf
- 后腹腔镜手术并发高乳酸血症的危险因素分析.pdf
- 后腹腔镜下CO2气腹对老年患者脑氧饱和度及S-100β蛋白的影响.pdf
- 呼出气一氧化氮和外周血嗜酸性粒细胞计数在嗜酸性粒细胞型哮喘中的诊断价值.pdf
- 呼出气一氧化氮联合小气道功能在咳嗽变异性哮喘中的应用.pdf
- 呼吸科住院患者静脉血栓栓塞症风险评估及干预现状调查.pdf
- 护理本科生患者安全教育知识体系的构建研究.pdf
- 护理结局分类系统在糖尿病病人健康教育中的应用研究.pdf
- 护士抗肿瘤药物、免疫抑制剂与免疫调节剂、血液及造血系统药物处方权内容的研究.pdf
- 护士气管切开术后集束化护理知信行问卷的编制及应用研究.pdf
- 六年级数学下册教学课件《解比例》.pptx
- 8.21.5 鸟类的生殖与发育(课件)八年级生物下册课件(苏教版).pptx
- 钠离子电池项目智能制造方案(范文参考).docx
- 2023-2024学年吉林省吉林市舒兰市七年级(上)期末语文试卷.docx
- 2024年吉林省吉林市丰满区亚桥实验学校中考数学三模试卷.docx
- 2023-2024学年吉林省辽源市东辽县七年级(上)期末英语试卷.docx
- 2023-2024学年吉林四平九年级数学第一学期期末水平检测试卷.docx
- 2023-2024学年吉林市蛟河市三校联考九年级(上)期末英语试卷.docx
- 2023-2024学年吉林松原九年级英语上册考场实战试卷.docx
- 电解液新材料项目智能制造方案.docx
文档评论(0)