《判别分析》课件.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第一节引言

1

第四章判别分析

第二节距离判别法

第三节贝叶斯(Bayes)判别法

第四节费歇(Fisher)判别法

第五节实例分析与计算机实现

一Fisher判别的基本思想

二Fisher判别函数的构造

三线性判别函数的求法

3

右图中有A、B两个总体。在原始变量(指标)X1、X2的方向上,A、B都有很大的重叠,难以区分清楚。但是,如果以X1、X2为横、纵坐标轴构建一个平面,若能设法找到一个y轴,使得当X1X2平面上的散点投射到y轴上时,两组观察值的重叠程度最小,则综合指标y的区分能力显然大于原先的X1、X2。

y

x2

x1

4

6

1、针对两个总体的情形

7

8

9

11

12

13

14

15

16

18

另外一种求4.23式的思路*

19

另外一种求4.23式的思路*

20

另外一种求4.23式的思路*

21

23

25

经典案例:费希尔于1936年发表的鸢尾花(Iris)数据,被广泛用为判别分析的例子。数据是对3种鸢尾花:刚毛鸢尾花(第一组)、变色鸢尾花(第二组)和弗吉尼亚鸢尾花(第三组),各自抽取一个容量为50的样本,测量其花萼长度x1、花萼宽度x2、花瓣长度x3、花瓣宽度x4,单位为mm。

30

31

35

36

Fisher判别与距离判别对判别变量的分布并无要求,而贝叶斯判别要求了解判别变量的先验分布,因此,Fisher判别核距离判别相对于贝叶斯判别,较为简单实用;当然,后者更加精确。

当k=2且两个总体协差阵相等时,Fisher判别与距离判别是等价的。当判别变量服从正态分布,且不考虑误判代价时,它们与贝叶斯判别也是相同的。

X1:0岁组死亡概率

X4:55岁组死亡概率

X2:1岁组死亡概率

X5:80岁组死亡概率

X3:10岁组死亡概率

X6:平均预期寿命

表4.1各地区死亡概率表

这两个选项的含义如下:

49

Fisher’s:给出Bayes判别函数的系数。(注意:这个选项不是要给出Fisher判别函数的系数。这个复选框的名字之所以为Fisher’s,是因为按判别函数值最大的一组进行归类这种思想是由Fisher提出来的。这里极易混淆,请同学注意。)

Unstandardized:给出未标准化的Fisher判别函数(即典型判别函数,也即我们前面讲过的“中心化的Fisher判别函数”)的系数(SPSS默认给出标准化的Fisher判别函数系数)。

1

2

Box’xM是对各总体协差阵是否相等进行齐性检验

Means可给出各总体均值是否相等的Wilks统计量。

Within-groupscorrelation给出各自变量之间的相关系数矩阵

最后点击“Continue”回到上一级菜单。

52

Save子对话框

57

协差阵齐性检验结果:

由于样本资料矩阵的秩小于5(p-1)(原因?),不是非奇异矩阵,无法给出Box’s检验结果。

可见,第1、2、6个指标的同均值,确实对检验产生了影响

可见,判别分析开始前,有必要对各个总体的均值是否相等进行假设检验。

01

接下来,出于课堂演示的需要,我们继续使用原有全部六个指标,进行后续的判别分析

02

典型相关系数(CanonicalCorrelation)的平方,说明了判别函数因变量的变动,可以在多少程度上由自变量的变化所解释;

01

也即,该平方项反映这个判别函数携带了多少原始数据的信息,该值反映了该判别函数的信息价值,当然越大越好。

02

Canonical

Thecoefficientssuggesttherelativeimportanceofthepredictorvariables.

Consideronlytheabsolutesizeofthecoefficients.

Biggermeansmoreimportant.系数的绝对值越大,说明该自变量(predictorvariables)在这个判别函数中就越重要。

70

3.结构矩阵

StructureMatrixFunction

Thestructurematrixshowstheabsolutecorrelationsbetweeneachpredictorvariableandthecanonicalvariable.

结构矩阵中的元素,是原始变量与典型变量(标准化的典型判别函数)的相关系数

Meaning?

Ifavariableisastrongpredictor,itwillcorrelatestronglywiththecalculatedvalueoft

文档评论(0)

135****2083 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档