判别分析优选文档.pptVIP

  • 0
  • 0
  • 约1.99千字
  • 约 88页
  • 2026-02-01 发布于山东
  • 举报

判别分析;(优选)第六讲判别分析;

分类学是人类认识世界的基础科学。聚类分析和判别分析是研究事物分类的基本方法,广泛地应用于自然科学、社会科学、工农业生产的各个领域。

在自然科学和社会科学的各个领域经常遇到需要对某个个体属于哪一类进行判断。如动物学家对动物如何分类的研究和某个动物属于哪一类、目、纲的判断。;判别;判别分析是根据观测到的某些指标对所研究的对象进行分类的一种多元统计分析方法。在医学研究中经常遇到这类问题;例如,临床上常需根据就诊者的各项症状、体征、实验室检查、病理学检查及医学影像学资料等对其作出是否有某种疾病的诊断或对几种可能患有的疾病进行鉴别诊断,有时已初步诊断为某种疾病,还需进一步作出属该类疾病中哪一种或哪一型的判断。;聚类分析是根据事物本身的特性研究个体分类的方法,原则是同一类中的个体有较大的相似性,不同类中的个体差异很大。

判别分析是根据表明事物特点的变量值和它们所属的类,求出判别函数。根据判别函数对未知所属类别的事物进行分类的一种分析方法。;主要不同点就是,在聚类分析中一般人们事先并不知道或一定要明确应该分成几类,完全根据数据来确定。

而在判别分析中,至少有一个已经明确知道类别的“训练样本”,利用这个数据,就可以建立判别准则,并通过预测变量来为未知类别的观测值进行判别了。;聚类分析;聚类要注意的问题;判别分析;概述

距离判别法

贝叶斯判别法

费歇尔判别法

逐步判别法;*;判别分析的一般步骤;*;*;*;判别分析的假设前提;第二节距离判别;*;*;*;*;*;;*;*;*;*;线性判别函数:;*;*;*;*;*;*;*;*;;*;*;*;*;*;*;*;*;*;*;*;*;*;*;*;*;下表是某金融机构客户的个人资料,这些资料对一个金融机构来说,对于客户信用度的了解至关重要,因为利用这些资料,可以挖掘出许多的信息,建立客户的信用度评价体系。所选变量为:

x1:月收入

x2:月生活费支出

x3:虚拟变量,住房的所有权,自己的为“1”,租用的“0”

x4:目前工作的年限

x5:前一个工作的年限

x6:目前住所的年限

x7:前一个住所的年限

x8:信用程度,“5”的信用度最高,“1”的信用度最低。

;第四节Fisher判别法;Fisher判别法(先进行投影);用家庭收入和草地面积来区别城市中家庭可能购买割草机和不太可能购买割草机;从距离判别法,我们已经看到判别规则是一个线性函数,由于线性判别函数使用简便,因此我们希望能在更一般的情况下,建立一种线性判别函数。Fisher判别法是根据方差分析的思想建立起来的一种能较好区分各个总体的线性判别法,Fisher在1936年提出。该判别方法对总体的分布不做任何要求。

;*;*;*;为了使判别函数能够很好地区别来自不同总体的样品,自然希望:

i)来自不同总体的两个平均值相差愈大愈好。;有了判别函数之后,欲建立判别准则还要确定判别临界值(分界点)y0,在两总体先验概率相等的假设下,一般常取y0为和的加权平均值即;(3)计算步骤

i)建立判别函数;*;*;结论;设在维总体的情况下,的线性组合为

其中为维向量。设和的均值向量分别为和,且有公共的协方差阵

。那么线性组合的均值为

;令

则有

于是Fisher判别准则为:;注意到

Fisher判别准则可写为:

这就是马氏距离最小判别准则。;*;*;*;*;记和分别是总体内x的样本均值向量和样本协差阵,根据求随机变量线性组合的均值和方差的性质可知,在上的样本均值和样本方差为;*;定理设为的个非零特征值,,为相应的特征向量(满足),则时使得式达到最大,称为第一判别函数。除去,则是在约束条件之下使得式达到最大的解,称为第二判别函数。类推下去,除去,则是在约束条件

之下使得式达到最大,称为第个判别函数。;*;*;*;*;ii)加权法

考虑到每个判别函数的判别能力不同,记

其中是的非零特征根。

若则判。;*

文档评论(0)

1亿VIP精品文档

相关文档