- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
章判别分析
PAGE
PAGE 67
第六章 判别分析
近年来,判别分析在植物分类、天气预报、经济决策与管理、社会调查、农业科研、科研数据整理分析中都得到了广泛的应用。判别分析是一种很有实用价值而且应用极其广泛的一种统计方法。本章介绍两种常用的判别方法:距离判别及Fisher判别。
§1 距离判别
距离判别是先给出一个样品到某个总体的距离的定义,然后根据样品到各个总体的距离的远近,来判断该样品应归属于哪一个总体。本节先介绍多元分析中广泛应用的马氏距离的概念,然后,再介绍距离判别的方法。
一、马氏距离
1.概念
距离是一个最直观的概念,多元分析中许多方法都可用距离的观点来推导,其中最著名的一个距离是印度统计学家Mahalanobis于1936年引进的,所以习惯上称之为马氏距离。下面我们很快会看到,马氏距离是我们熟知的欧氏距离的一种推广。
定义???设P维总体G的均值向量为u,协差阵为V0(有V-10存在)X,Y是总体G的两个样品,则:
(1)X与Y两点的马氏距离d(X,Y)为:
(2) X与总体G的马氏距离为:
2.性质
很容易证明,马氏距离符合作为距离的三条基本公理:
设X,Y,Z是总体G的三个样品,则有:
(1)非负性:
(2)对称性:
(3)满足三角不等式:
证:(2)
其它性质不证。
由马氏距离的定义知,当V=E时,X与Y的马氏距离就变成为欧氏距离:
所以,马氏距离是欧氏距离的推广,欧氏距离是马氏距离的特例。
有了马氏距离的概念,我们就可用马氏距离作为尺度来判别样品的归属。
3.计算
以二维为例介绍一下计算。设二维总体G的均值向量为,协差阵为,求点和与总体G之间的欧氏距离与马氏距离。
解:
(1)欧氏距离
(2)马氏距离
二、判别规则
下面介绍一下两个总体的距离判别规则
设有两个P维总体G1与G2,对于给定的一个样品Z,要判断Z是来自哪一个总体。一般方法是:
先计算出Z到G1与G2的两上马氏距离d(与d(,然后按下述规则进行判别:
,当
,当
为便于应用,我们考察Z到G2的马氏距离的平方与Z到G1的马氏距离的平方之差:
令
则判别规则可写成:
(1)当已知时,令
,则a为已知的P维向量,这时
为Z的线性判别函数,a为判别系数。由,求出a
(2)当未知时,可求出相应的估计值,再代入上述函数,求出a。
估计值求法如下:
其中
三、例题
设从同协方差阵V的两个总体G1,G2中抽取了三个样品,测定A、B两个指标数据如表
指标G1G2123123A71013156B151719357
试用距离判别确定样品,的归属
解:(1)求均值:
记
(2)求协方差阵:
(3)求判别系数:
令
即
即
解得 a1=-24,a2=36
(4)求判别函数
(5)判别:
§2 Fisher判别
现以两个总体为例,介绍Fisher判别的方法。
设,且
]
,且
现在研究待识样品属于G1还是属于G2?
这里仅从样本出发,来估计总体的均值与协差阵,介绍一下Fisher判别的基本思想与计算方法。
一、基本思想
Fisher判别是借助于方差分析的思想来导出判别函数。这个判别函数可以是线性函数,也可能是其它函数,在正态母体、协差阵相等的情况下,可以导出一个线性判别函数,这里仅就此作一介绍。
记
并定义:组间协差阵
组内协差阵 ,即
对一个固定的,值越大,组与组间相隔越远;越小,组内样本间越靠近。于是可定义判别效率
欲判别效率最好,即使取最大值,可得为判别系数,判别函数为
即
其中
二、计算方法
1.计算平均值
2.计算组内协差阵即计算出差阵
其中
3.求判别系数
或
解方程组可得 c1,…,cm
4.建立判别函数,并计算临界值
且计算临界值:
比较,有或
5.计算判别值:计算待识样品判别值并进行判别。
对任一特征样品
计算判别值
若位于R0的R1一边,则
若位于R0的R2一边,则
6.显著性检验:检验均值差异显著性
其中
若 ,则拒绝H0
7.计算判别的正确率
正确率=(新类与原类相同样品数/样品总数)100%
三、例题
从两总体G1,G2中分别抽了三个样品,各测定了A、B两个指标,数据如表
总体
样品号
指标G1G21
2
3
1
2
3
A71013156B151719357
试用Fisher判别,确定样品,的归属
解:(1)计算
(2)求S1,S2及S1+S2
(3)求判别系数
从方程组
解得:c1=-24,c2=36
(4)建立判别函数并计算临界值
经计算得:
且
(5)计算判别值
有
(6)显著性检验
而 ,且
所以G1,G2两总体平均值
文档评论(0)