网站大量收购独家精品文档,联系QQ:2885784924

csm_1124_医学统计.docVIP

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
csm_1124_医学统计

判别分析 判别分析是判别样品所属类型的一种统计方法,如在医疗诊断中,根据某人多种检验指标来判别此人是某病患者还是非患者。 (一)基本思想不同在聚类分析中, 所有样品或个体所属类别是未知的, 分析的依据就是原始数据, 没有任何事先的有关类别的信息可参考。而判别分析中,是已知个体所属类别,根据有关类别的信息建立判别函数,再利用该判别函数判断未知类别的个体。在实际分析中, 当对样本的分类不清楚时, 可以先聚类分析, 然后进行判别分析。 (二)分类依据不同聚类分析依据“距离”或“相似系数”分类;判别分析依据判别函数或概率来分类。 (三)数据要求不同聚类分析并不是一种纯粹的统计技术, 其方法基本上与分布理论和显著性检验无关, 一般不从样本推断总体。而在判别分析中, 对于分布理论非常关注, 它 有一个基本假设: 每一个类别都应取自一个多元正态总体的样本, 而且所有正态总体的协方差矩阵或相关矩阵都假定是相同的。 判别分析应满足的前提条件 (1)样本数量应尽可能大; (2)对已知分类或分组(即:因变量)的标准要尽可能客观、准确和可靠,这样建立起来的判别函数才能起到准确的判别效果; (3)自变量(即:观察指标)和因变量之间要有重要的影响关系,选择自变量时应挑选既有区别能力又有重要特性的指标,这样可以用最少的变量达到高判别能力的目标; (4)各观察指标变量应是连续型变量,判断类别或组别变量应是分类变量; (5) 各观察指标变量尽可能服从正态分布; (6)所选择的各观察指标变量之间的相关性应较弱,即相关性检验不能达到显著水平,且2个变量之间的相关性在不同的类别或组别中应一致。2 判别分析方法包括: 距离判别 Fisher判别(费歇尔判别) Bayes判别(贝叶斯判别) 最大似然判别 逐步判别2010-10-20 距离判别 一.原理 对已知分类的数据,分别计算各类各指标的均值(即各类的重心),然后根据判别准则来归类,若待判样品与第k类中各均值的距离最近,则它来自于第k类;若它到各类的距离是相等的,则它暂不归类。所以距离判别法又称为最邻近方法,其中判别准则即为 就近归类。距离判别法适用于任意分布的资料。2010-10-20 Fisher 判 别 一.原理已知A、B两类观察对象,A类9例,B类10例,分别记录X1、X2指标。Fisher 判别法就是找出一个线性组合(即:判别函数):Z=a+b1X1+b2X2 Z为综合指标,b1、b2为判别系数使得综合指标Z在两类中的均数?ZA与 ?ZB 的差异最大,而在两类内部的变异尽可能小。 二.判别规则建立判别函数,计算每个个体的判别函数值Zi,分别求两类均数?ZA与?ZB (设?ZA ?ZB ),计算判别界值Zc:判别规则即为: 判为A类判为B类 暂不归类或判为任一类 ? ? Bayes判别 一.原理:利用各类已知的先验概率,分别得到各类的Bayes判别函数:Yk=a+b1X1+b2X2+… 每类有一个判别函数,Yk为判别函数值;b1、b2为判别系数。对某个体分别计算它属于各类的后验概率,哪个后验概率最大,就判为哪一类。2010-10-20 如果各类的先验概率未知,先验概率如何确定: (1)一般可认为各类的先验概率相等,如有3类,则3类的先验概率均为1/3,即0.333。 (2)另外,可用各类的样本个数所占总个数的比例作为各类先验概率的估计,如3类的样本个数分别为30、30、40,总个数为100,则3类的先验概率分别为0.3、0.3、0.4。 如果抽样存在选择性偏倚,则(1)方法更妥当。2010-10-20 Fisher判别与Bayes判别的区别 1. 对总体数据的分布要求不同:Fisher判别对数据分布没有特殊的要求;Bayes判别要求数据分布是多元正态分布,但在实际操作过程中,要求并不严格。 2. 适用的类别不同:Fisher判别适用于两组判别分析;Bayes判别适用于多组判别分析。 3. 在SPSS中的选项内容不同:Fisher判别函数系数对应于“Unstandardized”选项; Bayes判别函数系数对应于“Fisher’s linear discriminant functions”选项。因为,“按判别函数值最大的一组进行归类”这种思想是Fisher提出来的,因此SPSS用Fisher对Bayes方法进行了命名。 最大似然判别 该法适用于观察指标为分类性质的两类判别或多类判别2010-10-20 判别原理: 用独立事件的概率乘法定理得到某个体属于各类的概率大小,然后概率最大的类别即为该个体的类别。(类似于Bayes判别原理)2010-10-20 逐步判别 该法适用于观察指标较多的Fisher判别分析或Bayes判别分析,类似于逐步回归的统计思维。 目的是:选取具有判别效能的指标建立判别函数,使判别函

文档评论(0)

pengyou2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档