网站大量收购闲置独家精品文档,联系QQ:2885784924

章判别分析.docVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
章判别分析

PAGE  PAGE 67 第六章 判别分析 近年来,判别分析在植物分类、天气预报、经济决策与管理、社会调查、农业科研、科研数据整理分析中都得到了广泛的应用。判别分析是一种很有实用价值而且应用极其广泛的一种统计方法。本章介绍两种常用的判别方法:距离判别及Fisher判别。 §1 距离判别 距离判别是先给出一个样品到某个总体的距离的定义,然后根据样品到各个总体的距离的远近,来判断该样品应归属于哪一个总体。本节先介绍多元分析中广泛应用的马氏距离的概念,然后,再介绍距离判别的方法。 一、马氏距离 1.概念 距离是一个最直观的概念,多元分析中许多方法都可用距离的观点来推导,其中最著名的一个距离是印度统计学家Mahalanobis于1936年引进的,所以习惯上称之为马氏距离。下面我们很快会看到,马氏距离是我们熟知的欧氏距离的一种推广。 定义???设P维总体G的均值向量为u,协差阵为V0(有V-10存在)X,Y是总体G的两个样品,则: (1)X与Y两点的马氏距离d(X,Y)为: (2) X与总体G的马氏距离为: 2.性质 很容易证明,马氏距离符合作为距离的三条基本公理: 设X,Y,Z是总体G的三个样品,则有: (1)非负性: (2)对称性: (3)满足三角不等式: 证:(2) 其它性质不证。 由马氏距离的定义知,当V=E时,X与Y的马氏距离就变成为欧氏距离: 所以,马氏距离是欧氏距离的推广,欧氏距离是马氏距离的特例。 有了马氏距离的概念,我们就可用马氏距离作为尺度来判别样品的归属。 3.计算 以二维为例介绍一下计算。设二维总体G的均值向量为,协差阵为,求点和与总体G之间的欧氏距离与马氏距离。 解: (1)欧氏距离  (2)马氏距离 二、判别规则 下面介绍一下两个总体的距离判别规则 设有两个P维总体G1与G2,对于给定的一个样品Z,要判断Z是来自哪一个总体。一般方法是: 先计算出Z到G1与G2的两上马氏距离d(与d(,然后按下述规则进行判别: ,当 ,当 为便于应用,我们考察Z到G2的马氏距离的平方与Z到G1的马氏距离的平方之差: 令  则判别规则可写成: (1)当已知时,令 ,则a为已知的P维向量,这时 为Z的线性判别函数,a为判别系数。由,求出a (2)当未知时,可求出相应的估计值,再代入上述函数,求出a。 估计值求法如下: 其中  三、例题 设从同协方差阵V的两个总体G1,G2中抽取了三个样品,测定A、B两个指标数据如表 指标G1G2123123A71013156B151719357 试用距离判别确定样品,的归属 解:(1)求均值: 记  (2)求协方差阵: (3)求判别系数: 令  即  即  解得 a1=-24,a2=36 (4)求判别函数 (5)判别: §2 Fisher判别 现以两个总体为例,介绍Fisher判别的方法。 设,且 ] ,且 现在研究待识样品属于G1还是属于G2? 这里仅从样本出发,来估计总体的均值与协差阵,介绍一下Fisher判别的基本思想与计算方法。 一、基本思想 Fisher判别是借助于方差分析的思想来导出判别函数。这个判别函数可以是线性函数,也可能是其它函数,在正态母体、协差阵相等的情况下,可以导出一个线性判别函数,这里仅就此作一介绍。 记  并定义:组间协差阵  组内协差阵 ,即 对一个固定的,值越大,组与组间相隔越远;越小,组内样本间越靠近。于是可定义判别效率  欲判别效率最好,即使取最大值,可得为判别系数,判别函数为 即  其中  二、计算方法 1.计算平均值 2.计算组内协差阵即计算出差阵 其中  3.求判别系数  或  解方程组可得 c1,…,cm 4.建立判别函数,并计算临界值 且计算临界值: 比较,有或 5.计算判别值:计算待识样品判别值并进行判别。 对任一特征样品  计算判别值  若位于R0的R1一边,则 若位于R0的R2一边,则 6.显著性检验:检验均值差异显著性 其中  若 ,则拒绝H0 7.计算判别的正确率 正确率=(新类与原类相同样品数/样品总数)100% 三、例题 从两总体G1,G2中分别抽了三个样品,各测定了A、B两个指标,数据如表 总体 样品号 指标G1G21 2 3 1 2 3 A71013156B151719357 试用Fisher判别,确定样品,的归属 解:(1)计算 (2)求S1,S2及S1+S2 (3)求判别系数  从方程组  解得:c1=-24,c2=36 (4)建立判别函数并计算临界值 经计算得: 且  (5)计算判别值 有  (6)显著性检验 而 ,且  所以G1,G2两总体平均值

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档