- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[数学]数学建模第四轮心脏病判别
心脏病判别
摘 要
心脏病的判别指标有很多种,本文解决的就是如何根据这些指标判别心脏病以及这些指标的关键程度.结合多元线性回归分析法对数据作初步处理和分析,利用Fisher判别法和SVM神经网络法分别建立判定模型,并进行正确率检验,以比较得到心脏病的最佳诊断方法.
对于问题一: 先用Fisher判别模型对附录二中的数据进行判别检验,得到判别的准确率仅为47.92%.再用线性不可分的SVM神经网络模型进行相同的判别检验,得到判别的准确率为76%,明显高于前者,故我们选用SVM神经网络模型来判别心脏病及患病程度的方法.
对于问题二: 经过比较后,用线性不可分的SVM神经网络对问题二进行求解,得到44人中只有第9、15、21、26、28、29、38、39号这 8人患有程度为1的心脏病,其他人无心脏病.
对于问题三: 用主成分分析法分析附录二的数据特征,最后确定剔除掉B、C、D三个次要的指标,其余十项关键因素保留,减少了化验的指标,提高了诊断效率.接着,我们用SVM神经网络模型对剔除后的总体进行检验得到判别的准确率为72%,比没剔除之前仅少了4%.可见,这样的剔除还是比较合理的.
对于问题四: 根据第三问的结果,重复问题二的工作,求解得到44名就诊病人均不患心脏病.这个结果与问题二的结果相似度约为82%,可见,问题三中的剔除确实比较合理.
关键词: 多元回归分析 Fisher判别法 SVM神经网络 主成分分析法
1. 问题重述
1.1问题背景:
心脏是维持全身血液循环的最重要器官.由于现代人不正确的饮食和运动习惯等因素,心脏病患者人数逐年上升,心脏病已经成为威胁人类生命的十大疾病之一,除了老年人,中青年也成为心脏病猝死的高危人群.年轻人的心脏病突发往往没有明显先兆,突然发作时很危险,心脏病的病因很多,有时很难判断一个人是否患有心脏病.
1.2题目所给信息:
一,各项指标A,B,…M的含义(见附录一),指标N表示是否确诊为心脏病以及患病的程度;
二,到某医院做心脏病检测的一些确诊者的生理指标数据(见附录二);
三,44名待确诊的就诊人员的生理指标数据(见附录三).
1.3本文需解决的问题有:
问题一: 根据附录一中的数据,提出判别心脏病以及患病程度的方法,并检验方法的正确性.
问题二: 按照问题一提出的方法,判断附录三中的44名就诊人员的患病情况.
问题三: 能否根据附录二的数据特征,确定哪些指标是影响人们患心脏病的关键或主因素,以便减少化验的指标.
问题四: 根据问题三的结果,重复问题二的工作,并与问题二的结果对比作进一步分析.
2. 模型的假设与符号说明
2.1模型的假设
假设1: 通过题目中所给13种可以判定是否患心脏病及患心脏病的程度;
假设2: 人在健康状况时,题目中所给的值基本相同;
假设3: 不考虑除患病外其他因素对对题目中所给的影响;
假设4: 正常人除性别年龄外其他基本相差不大;
假设5: 本题所提供的确病例的结果和就诊人员的结果基本都是准确可信的.
2.2符号说明
符号 符号说明 附录二分出的总体数5 总的指标项的数目 每个总体中样本的组号 第个总体, 第个总体抽取的样品数 第个总体的第组样品的指标化验结果 总体内的样品均值向量 总体内的样品协方差阵 Fisher 判别函数的系数向量 人为的正加权系数 组内离差阵 总体之间的样本协方差阵 相关系数矩阵 3. 问题分析
在心脏病的判别中,需要检查多项生理指标,最终综合考虑检查结果得出心脏病的判别结果.在实际的检查判别中,由于检查的种类繁杂,需要我们从有效性与经济性的角度考虑,提出更具体优良的判别心脏病及患病程度的方法.因此,我们首先考虑在数据分析中,用回归分析法对各项化验指标与心脏病的相关性作初步分析,为下面问题的分析求解奠定基础.因为要解决的是判别类问题,通过对大量的模型的分析和筛选,我们提出用Fisher判别法建立模型,然后用SVM神经网络算法来进一步检验.下面我们将对题目所给出的问题做具体分析并给出具体的求解方案.
针对问题一: 根据题目所给的附录二的数据表,我们知道心脏病的判别结果分为五种,即不患病、患病程度1、患病程度2、患病程度3、患病程度4,故我们把附录二表中的数据总体依患病程度分为五个总体().然后分别从五个总体中按比例抽取样品,剩下留作检验,分别利用多总体的Fisher判别法和SVM神经网络算法得到心脏病判别的准确率,比较两种结果,得到最终的判别方法.
针对问题二: 利用问题一得到最总判别方法,对附录三中的44名就诊人员的患病情况进行判别.
针对问题三: 通过在数据分析中对附录二数据的初步分析,我们得到了关于部分指标对心脏病判别影响的初步猜想.然后,我们用主成分分析法来分析附录二的数据,得
文档评论(0)