- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
--(完美WORD文档DOC格式,可在线免费浏览全文和下载)值得下载!
化验检查诊断问题
摘要 125
本文研究的是如何通过人体内各种元素含量肾炎判别方法,判别属于患者或健康人的方法人们到医院就诊时,通常要化验一些指标来协助医生的诊断。诊断就诊人员是否患肾炎时,通常要化验人体内各种元素含量。表B.1是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确定为健康人的结果。表B.2是就诊人员的化验结果。根据表B.1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验提出方法的正确性按照1的方法,表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人
(3)根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。
根据3的结果,重复2的工作
二.问题分析
对于问题一,我们找到了常用的判别分析方法有:Bayes判别、Fisher判别、距离判别,而Bayes判别的数据必须满足多元正态分布。所以,我们先利用spss软件对表B.1中原始数据进行了多元正态检验,得出8种元素的显著性水平均小于0.05,拒绝接受正态分布的原假设,因此不能使用Bayes判别。接着,我们以B.1中的数据为训练样本作为检验集,用Fisher判别和马氏距离判别对样本进行判断,得出:Fisher判别的回待误判率和交叉误判率分别是6.3%、8.3%;马氏距离判别的回待误判率和交叉误判率分别是11.7%、11.7%。所以Fisher判别比马氏距离判别更适合于此问题的研究。
对于问题二,通过问一我们已经知道,Fisher判别比马氏距离判别的准确性更高,所以更适合于此问题的研究,所以我们利用Fisher判别求出了30个就诊人员的重心(即F值)进一步计算它们分别距两类重心的距离,对30位就诊人员进行判别,得出30人中有15人未患病而15人患病。
采用Fisher判别对表B.2的数据进行判别,得出结论为:15人未患病和15人患病。
对于问题三,我们利用主成分分析对化验的7个指标进行了相关性的分析,得出:Na和K两者的相关性很强,Ca、Cu和Mg之间的两两相关也非常密切,且相关系数均在0.71以上。由于这些指标间的相关性很强,为了优化指标,我们可以采用其中的一个指标Ca作为这三个指标的综合指标,K作为Na和K的综合指标。这样,我们得到优化后的指标为Zn、Fe、Ca、K。
对于问题四,我们结合问三以优化后的4个指标Zn、Fe、Ca、K作为检验指标,利用Fisher判别重新对B.2表中的就诊人员进行判别,并将得出的数据于原始指标下的判别数据相比,得出:出现5个误判,其中4人没病被误判成有病,1人有病被误判成没病,总的误判率为=16.7%.优化后的指标虽然大大缩减了化验工作但在一定程度上增加了误判的概率。
最后我们对模型进一步的做了检验,提出了改进方案和模型推广
三.模型假设
(1)每个病人的化验结果是相互独立的;
(2)化验结果的数据都是有效的,不存在异常值;
(3)在检验过程中的误判不存在偶然误差
(4)未患病的就诊人员体内的指标元素含量正常;
四.变量与符号说明
:回代误判率;
:交叉误判率;
:表示小椭圆油罐横截面的长半轴长,单位米;
:特征根;
模型建立与求解
5.1判据方法的试用性分析
Bayes判别将所有类看作是空间中互斥的子域,每个观测点都是空间中的一点,它适合于多总体判别,它要求原始数据满足多元正态分布并且多元正态的协方差阵相等;Fisher的使用对总体的分布和方差都没有特殊的要求,且不需要做假设分布;马氏距离排除了指标间的相关性干扰,且不受量纲的影响。
由于题目并没有说明表中的数据是满足正态分布的,所以我们先对数据进行正态分布检验,检验之后判断是否还适合用 Bayes判别。
由于表中所给的7种元素的值是不带单位的,我们很难判断他们是否处于处于同一个数量级,相应的均值和方差也不能确定,所以Fisher和马氏距离判别适合于此问题的分析;
5.2问题一的模型与建立
5.2.1多元正态分布的检验
我们利用SPSS软件导入数据得到的多元正态分布的检验表。
表1
正态性检验 Kolmogorov-Smirnova Shapiro-Wilk 统计量 df Sig. 统计量 df Sig. Zn .181 60 .000 .888 60 .000 Cu .278 60 .000 .442 60 .000 Fe .303 60 .000 .524 60 .000 Ca .148 60 .002 .827 60 .000 Mg .148 60 .002 .728 60 .000 K .305 60 .000 .4
文档评论(0)