- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
--(完美WORD文档DOC格式,可在线免费浏览全文和下载)值得下载!
化验结果诊断模型
问题重述与分析
人们到医院就诊时,通常要化验一些指标来协助医生的诊断。本题给出了人们是否患某种疾病时通常要化验的几种指标以及其检验值。表1是确诊病例的化验结果,其中1-30号病例是已经确诊为患该种疾病的化验结果;31-60号病例是已经确诊为健康人的结果。表2是某些就诊人员的化验结果,但未确诊其是否患有该种疾病。根据已知数据,需要解答如下问题:
问题:根据表1中的数据,提出一种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。
分析:
根据表1当中60个化验结果,将Zn、Cu、Fe、Ca、Mg、K、Na看成是七个指标,则前30个为该疾病患者的指标值,后30个为健康人的指标值, 可以将这些数据进行标准化处理,再采用主成分分析方法,将多个指标转化为几个综合指标,当给定一个患者的各指标值时,可以算出各综合指标的得分,当这些得分满足一定条件时,如根据正负值可以判定为健康或疾病。
问题:按照(1)提出的方法,对表2中的15名就诊人员的化验结果进行判别,判定他们是患该种疾病的病人还是健康人。
分析:
由(1)中已有的综合指标,根据给定的15名就诊人员的指标值计算出综合指标的得分,以此判断他们的健康状况。
问题:能否根据表1的数据特征,确定哪些指标是影响人们患该疾病的关键或主要因素,以便减少化验的指标。并根据你给出的结果,重复2的工作。
分析:
为了确定哪些指标是影响该疾病的主要因素,则需要确定出哪些因素在判别中起的权重最大,可以考虑采取回归模型,通过去除一些变量,然后比较各组的显著性与正确率,正确率最高的那组中的变量即为影响该疾病的主要因素。
模型假设
假设医院化验设备先进,化验过程科学可靠,化验结果真实可信,确诊情况(有病/健康人)符合实际。
在解决本题过程中,所有的化验结果只是针对该类疾病检验,并不考虑其他疾病的影响。
本文所建模型的检验结果只是作为医生为病人诊断的一个参考,医生为问诊人员作出最终判定还需考虑其他因素,但与本题求解无关。
符号说明
模型建立与求解
问题一的求解:
模型一:
数据“标准化”
题目已给出了60为确诊病例的化验结果以及诊断结果,但是60个病例中各元素的含量的呈无规律性。所以我们需要对原始数据进行处理,首先对其进行标准化分析:
用向量 =表示每个就诊人员的化验结果,则
=表示第α病人的化验结果。将每个指标“标准化”,即做如下变换:
其中,
标准化的数据见附录一。
主成分分析
对标准化的数据运用SPSS软件进行主成分分析,结果如表1、表2:
表1
解释的总方差 成份 初始特征值 提取平方和载入 合计 方差的 % 累积 % 合计 方差的 % 累积 % 1 3.129 44.702 44.702 3.129 44.702 44.702 2 1.973 28.192 72.894 1.973 28.192 72.894 3 .723 10.327 83.221 4 .570 8.147 91.368 5 .284 4.052 95.420 6 .204 2.912 98.332 7 .117 1.668 100.000 由表1可以看出,前两个主成分,的方差和占全部方差的比例为72.894%,我们就选取为第一主成分,为第二主成分,基本上保留了原来7个指标的信息,这样得到了2个新指标。
SPSS软件得到的这成分系数矩阵如表2:
表2:
成份矩阵a 成份 1 2 x1 .453 -.538 x2 .852 .293 x3 .682 .195 x4 .898 -.051 x5 .941 .094 x6 -.206 .856 x7 -.005 .904 由表2得到前2个主成分,的线性组合为:
=
=(4.1)
模型验证
将60个就诊人员的化验结果带入(4.1)式得到结果如表3,我们的判别标准为:第一主成分为正值表示健康,为负值表示患病。
表3:
病例号 第一主成分 第二主成分 正误判标志(正=0;误=1) 1 -1.49142 0.23997 0 2 -1.14428 -0.18983 0 3 -1.28134 0.07538 0 4 -1.49664 1.27685 0 5 -0.5735 -1.82009 0 6 -1.58142 -1.32159 0 7 -1.22966 -1.94616 0 8 -1.76188 0.86386 0 9 -2.16782 -0.99101 0 10 -1.70022 0.09606 0 11 -3.45313 8.3533 0 12 -1.79041 0.81834 0 13 -0.42078 -0.98245 0 14 -1.8
文档评论(0)