费歇尔判别第三节.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
费歇尔判别第三节.ppt

(二)Fisher两类判别的计算步骤: 1、输入历史数据,计算 和 2、计算 3、解方程组 ,求出 ,建立判别函数 4、对新样本作判别 (1)将新样本p个观测值带入判别函数,求出y值 (2)确定临界值 分别将两类总体样本的判别函数之均值 求加权平均值 作为临界值。 5、作出判别 (1) (2) 试用各种判别方法对待判样本进行判类。 (1)1990联合国开发计划署公布的《人类发展报告》,用出生时的预期寿命(x1)、成人识字率(x2)、实际的人均GDP(x3 等三个变量衡量人类发展状况,现从高发展水平国家和中等发展水平国家中各选了5个样本,另选中国、希腊作为待判样本。要求: A、作距离判别分析(假定两总体协方差阵相等) B、作Fisher判别分析 距离判别: (a)计算两类样本均值: (b)计算样本协方差和总体协方差 c 求线性判别函数 d 待判样本规类: 中国: 判别到第二类。 希腊: 判别到第一类。 Fisher判别: (a)建立判别函数 (b)计算临界值y0 c 判别 将中国判别到第二类。 将希腊判别到第一类。 组间离差平方和 如果判别分析是有效的,则所有的样品的线性组合 满足组内离差平方和小,而组间离差平方和大。则 而 所对应的特征向量即 。 Fisher样品判别函数是 然而,如果组数k太大,讨论的指标太多,则一个判别函数是不够的,这时需要寻找第二个,甚至第三个线性判别函数 其特征向量构成第二个判别函数的系数。 类推得到m m k 个线性函数。 关于需要几个判别函数得问题,需要累计判别效率达到85%以上,即有 设 为B相对于E的特征根,则 以m个线性判别函数得到的函数值为新的变量,再进行距离判别。 判别规则: 设Yi X 为第i个线性判别函数, , 则 两个总体的费歇(Fisher)判别法 X 不能使总体 尽可能分开的方向 能使总体单位 尽可能分开的方向 旋转坐标轴至总体单位尽可能分开的方向,此时分类变量被简化为一个 费歇判别的基本思想是投影,将k组p维数据投影到某一个方向,使其投影的组与组之间尽可能地分开。 ? u ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 费歇判别的基本思想 Fisher判别法由Fisher在1936年提出,是根据方差分析的思想建立起来的一种能较好区分各个总体的线性判别法,该判别方法对总体的分布不做任何要求。 从两个总体中抽取具有p个指标的样品观测数据,借助于方差分析的思想构造一个线性判别函数: 系数 确定的原则 假设我们可以得到一个线性判别函数: 我们把两个总体的样品数据代入上面的判别式 使组间离差平方和最大,而组内离差平方和最小。 为了使判别函数能够很好地区分来自不同总体G1和G2的样品,自然希望: (2)来自同一总体的各个样品之间的差异越小越好。 即 的离差平方和 越小越好 即 的离差平方和 越小越好 1) 和 的差异越大越好 令 由于 故 其中 即 为两类总体的样本均值差 其中 令 是常数因子,不依赖于 它对方程组只起共同扩大倍数的作用,不影响判别结果,不妨取 于是得到 用矩阵表示: 因此得到 称 为判别函数. 两总体的 积差阵之和 两总体的 积差阵之和 判别临界值 其中 判别准则 ,则判别准则为: 例 某外贸公司为推销某一新产品,为保险起见,在新产品大量上市前将该产品的样品寄往12个国家的进口代理商,并附意见调查表,要求对该产品给予评估,评估的因素有式样、包装及耐久性三项。评分表用10分制,最后要求说明是否愿意购买,调查结果如下: 购买组 1 2 3 4 5 6 7 9 8 7 7 6 6 10 7 8 8 4 5 9 9 3 8 6 7 7 5 6 非购买组 1 2 3 4 5 4 4 4 3 6 6 6 3 3 2 4 5 1 2 2 第13个国家的进口代理商评分(9,5,8),问该代理商是否愿意购买此产品。 求两总体的样本均值 2. 求两总体样本均值之差 3. 求两总体的样本离差平方和矩阵E 先求各 4. 求判别系数 5. 得判别函数 6. 0.21692×8.29+0.0182×6.43+0.05604×6 2.251533 0.0987464 判别的临界值 则判别准则为: 7. 对已知类别的样品判别分类 对已知类别的样品(通常成为训练样品)用线性判别函数进行判别归类,结果如下表: 样品 原类号 判归

文档评论(0)

只做精品 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档