- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数学建模-心脏病的判别论文
第 PAGE 2 页 共 NUMPAGES 26 页
第 PAGE 1 页 共 NUMPAGES 26 页
心脏病的判别
摘 要
本文研究的是一个判别分析类问题,解决的是如何根据就诊者的各项生理指标数据,判别就诊者是否患有心脏病以及患病的程度,并确定哪些指标是影响人们患心脏病的关键因素,从而减少化验的指标,以便人们可以及时发现疾病。
首先我们对题目中给出的数据进行了处理,通过查找资料以及合理的判断,将-9进行了合理的赋值。
对于问题一,首先通过对患病情况的分析将患病程度划分为0、1、2、3、4五个总体,从而建立了多总体fisher判别模型,利用spss软件对13个判别指标进行分析,去除错误数据判别指标L、M,最后得出fisher判别函数,并利用求得的Fisher判别函数,对已给出的病患情况进行回代分析,最终回代结果显示“是否患病”的正确率为97.2%,判断“患病程度”的正确率为85.6%。
对于问题二,首先在问题一确定的判别函数和判别思想的基础上,通过分析,去除错误数据过多的判别指标L、M,得到了新的fisher判别函数。然后我们运用excel软件,将44名就诊人员的11项有效判别指标的数据代入判别函数求解,通过判断,得出各自的患病情况结果未写出来。。
结果未写出来。
对于问题三,运用主成份分析法进行判别指标的遴选。首先在问题一分析患心脏病程度与心脏病判别指标间联系的基础上,在保留心脏病判别指标的前提下,剔除心脏病检测指标中某些被认为可以被用于表示对应心脏病判别情况的部分。接着,运用主成份分析法,分析各判别指标对最终结果评判的影响,分析各成分指标间的贡献率,最终因此,我们得出H、C、K、J、I、M为主要因素。
对于问题四,首先我们在问题三遴选判别指标的基础上,运用spss软件对相关指标分析,建立多总体fisher 判别模型,得到相关系数,最终确定fisher 判别函数。接着利用与求解问题二相同的方法,将44名就诊人员13项指标的数据代入得出的判别函数中进行求解,将得出的结果与问题二中得到的结果比较,我们发现:筛选后所建立的判别方法及判别准则在判断“是否患病”时,正确率较高;而在判别“患病程度”时,就有一定的偏差数据。这与模型以及算法本身的准确度有一定的关系,也与我们处理数据时的正确性有一定关系。
数据
本文综合运用了fisher 判别法、主成份分析法等分析方法,构建相对应的fisher 判别模型,结合spss、excel等软件,对心脏病判别的问题进行了多角度的分析,并给出了利用筛减优化指标判别心脏病患病情况的方法。在文章的最后对所建模型的优缺点进行了分析,并对模型的适用范围进行了推广,在实际应用中有较大的参考价值。
关键字: 多总体fisher判别 主成份分析法 心脏病的判别
2.4问题四的分析
问题四要求依据问题三的结果,重复问题二中对于44名待诊患者患病情况的判断,并与问题二中的判别结果作比较。根据问题三中分析得到的可以用来判别患病情况的主成份指标,运用spss软件分析,通过fisher 判别方法,求得最终的fisher判别式,通过指标回代的方法,利用与问题二中类似的方法,可以分析得到减少分析指标后的患病情况分析结果。
最后将问题四中的结果和问题二中的结果作比较,分析出用两种不同的方法对患病情况预测的准确率。
三.模型的假设与符号说明
3.1模型假设
假设1:假定就诊人员的身体状况只有患心脏病和健康(非心脏病患者)两类,不考虑就诊人员的其他疾病因素以及身体素质的差异对疾病的影响。
假设2:假设除了表中列出的指标外,其他指标对是否患心脏病影响很小。
假设3:假设题目中所给的数据是在相同的条件下测得的。
假设4:假设样品的估计平均值、协方差分别等于总体的平均值、协方差
年龄
性别
胸痛类型
静息血压
血清中胆固醇含量 mg/dl
空腹时血糖 120 mg/dl
静息时心电图结果
最大心跳速率
运动是否诱发心绞痛
运动心电图ST下降程度
ST段斜坡
大血管属性
地中海贫血
心脏疾病的诊断结果
总体
样品
判别系数
F分布统计检定值
3.2符号说明
四.数据的预处理
4.1附录二数据的预处理
根据确诊者的表格信息(具体见附录二),其中患心脏病人数为93个,正常的为157个。由于数据中有‘-9’这一异常数据,为了便于模型的建立与分析,我们利用个案剔除法和均值替换法将数据作如下处理(各指标属性见符号说明):
(一)剔除法
(1)直接剔除法:对于指标L、M,由于在这两项判别指标中,数据-9在所数据中分别占有98.8%和89.2%的比率。由于比重过大,我们分析这两项指标可能对于最终患病情况的判别没有较大的影响,故而,在建立模型和模型的求解过程中,可以不予考虑这两项指标对心脏病结果的判
文档评论(0)