20章判别2015教材.ppt

第二十章 判别分析; 一、问题提出: ; 判别分析 ;判别分析 ;训练样本 ;样本量的要求;1.各自变量为连续性或有序分类变量。如果存在无序多分类变量,可以使用哑变量方式纳入。 2.样本来自一个多元正态总体。 3.各组的协方差距阵相等,该条件类似于方差分析中的方差齐性。 4.变量间独立,无共线性。 但是判别分析在违反这些适用条件时显得非常稳健,它们对结果的影响其实不大。;主要不同点就是,在聚类分析中一般人们事先并不知道或不一定要明确应该分成几类,完全根据数据来确定。 而在判别分析中,至少有一个已经明确知道类别的“训练样本”,利用这个数据,就可以建立判别准则,并通过预测变量来为未知类别的观测值进行判别。;目的:作出以多个判别指标判别个体分类的判别函数式或概率公式。 资料:个体分两类或多类,判别指标全部为数值变量或全部为分类变量。 用途:解释和预报(主要用于计量诊断)。 分类(经典): Fisher判别和Bayes判别。 ;1.计量资料判别分析。目的是作出以定量指标判别个体属性分类或等级的判别函数。;按方法名称分:;讲述内容;第一节???Fisher判别; 表20-1 22例患者三项指标观察结果(Zc=-0.147);1. Fisher判别的原理 ;(20-2);; 表20-1 22例患者三项指标观察结果;(20-6); 例20-1 收集了22例某病患者的三个指标(X1,X2,X3)的资料列于表20-1,其中前期患者(A)类12例,晚期患者(B)类10例。试作判别分析。; 表20-2 变量的均数及类间均值差 ;(2)计算合并协方差矩阵: 按公式(20-4),例如:; 表20-1 22例患者三项指标观察结果;(20-5); 表20-1 22例患者三项指标观察结果(Zc=-0.147);二、判别效果的评价——用误判概率P衡量 ; 第二级以后的判别函数可以用原来的指标,也可以更换其它指标。这种方法称为多级两类判别。进行多级两类判别时要特别注意归并类时有无实际意义。如果总类数比较少,判别效果可能较差。;第二节?? ?最大似然判别法(尤度法) ; 例20-2 有人试用7个指标对4种类型的阑尾炎作鉴别诊断,收集的5668例完整、确诊的病史资料归纳于表20-3。;???20-3 5668例不同型阑尾炎病例的症状发生频率(%) ;资料:个体分两类或多类,判别指标全部为定性或等级资料。 原理:用独立事件的概率乘法定理得到判别对象归属某类的概率(即:似然函数值=各指标的条件概率之积)。;表20-3 5668例不同型阑尾炎病例的症状发生频率(%) ;2.判别规则(找最大的似然函数值) ; 例20-2 有人试用7个指标对4种类型的阑尾炎作鉴别诊断,收集的5668例完整、确诊的病史资料归纳于表20-3。; 如某病例昨晚开始出现右下腹痛、呕吐等症状,大便正常。经检查,右下腹部压痛,肌性防御(+)、压跳痛(+),体温36.6℃,白细胞23.7×109/L。

文档评论(0)

1亿VIP精品文档

相关文档