- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
判别分析1
1.实验目的:
掌握判别分析方法的思想、判别分析步骤及判别结果分析。
2.实验内容
(1)自选数据或者使用例题4-1、4-2数据完成判别分析。
(2)对判别分析结果进行分析。
(3)选定两个样本,对样本进行分类。
3.实验步骤
例4-1:判别分析的一个重要应用是动植物的分类,最著名的一个例子是1936年费歇的鸢尾花数据。鸢尾花为法国的国花,Setosa、erisolor、Virginica是三种有名的鸢尾花,其萼片是绚丽多彩的,和向上的花瓣不同,花萼是下垂的。这三种鸢尾花很像,人们试图建立模型,根据萼片和花瓣的四个角度来对鸢尾花分类。该数据给出150朵鸢尾花的萼片长(sepal length)、萼片宽(sepal length)、花瓣长(petal width)、花瓣宽(petal width)以及这些分别属于的种类共五个变量。萼片和花瓣的长度为四个定量变量,而种类为分类变量。这里三种鸢尾花各有50个观测值。对数据进行判别分析的得到的分析结果如下:
表1-1 分析觀察值處理摘要
未加權的觀察值
N
百分比
有效
150
100.0
已排除
遺漏或超出範圍群組代碼
0
.0
至少一個遺漏區別變數
0
.0
遺漏或超出範圍群組代碼及至少一個遺漏區別變數
0
.0
總計
0
.0
總計
150
100.0
输出结果表1-1分析的是各组变量的描述统计量和对各组均值是否相等的检验。反应的是有效样本变量及变量缺失情况。
表1-2 群組統計資料
被解释变量
平均數
標準偏差
有效的 N (listwise)
未加權
加權
Setosa 鸢尾花
萼片长
5.0060
.35249
50
50.000
萼片宽
3.4280
.37906
50
50.000
花瓣长
1.4620
.17366
50
50.000
花瓣宽
.2460
.10539
50
50.000
Versico-lor 鸢尾花
萼片长
5.9360
.51617
50
50.000
萼片宽
2.7700
.31380
50
50.000
花瓣长
4.2600
.46991
50
50.000
花瓣宽
1.3260
.19775
50
50.000
Virginica 鸢尾花
萼片长
6.5880
.63588
50
50.000
萼片宽
2.9740
.32250
50
50.000
花瓣长
5.5520
.55189
50
50.000
花瓣宽
2.0260
.27465
50
50.000
總計
萼片长
5.8433
.82807
150
150.000
萼片宽
3.0573
.43587
150
150.000
花瓣长
3.7580
1.76530
150
150.000
花瓣宽
1.1993
.76224
150
150.000
表1-2是各组变量的描述统计分析
表1-3群組平均值的等式檢定
Wilks Lambda (λ)
F
df1
df2
顯著性
萼片长
.381
119.265
2
147
.000
萼片宽
.599
49.160
2
147
.000
花瓣长
.059
1180.161
2
147
.000
花瓣宽
.071
960.007
2
147
.000
表1-3是对各组均值是否相等的检验。由表1-3可以看出,在0.01的显著性水平下我们拒绝变量萼片长、萼片宽、花瓣长、花瓣宽在三组的均值相等的假设,即认为变量萼片长、萼片宽、花瓣长和花瓣宽在三组的均值是有显著差异的。
表1-4 對數行列式
被解释变量
等級
對數行列式
Setosa 鸢尾花
4
-13.067
Versico-lor 鸢尾花
4
-10.874
Virginica 鸢尾花
4
-8.927
聯合組內
4
-9.959
列印的行列式等級及自然對數是群組共變異數矩陣的等級及自然對數。
表1-5 測試結果
Boxs M 共變異等式檢定
146.663
F
近似值
7.045
df1
20
df2
77566.751
顯著性
.000
檢定相等母體共變異數矩陣的虛無假設。
输出结果1-4和表1-5是对各组协方差矩阵是否相等的Boxs’M检验。表1-4反映协方差矩阵的秩和行列式的对数值。由行列式值可以看出,协方差矩阵不是病态矩阵。表1-5是对个总体协方差矩阵是否相等的统计检验。由F值及其显著性水平,我们在0.05的显著性水平下拒绝原假设。因此在分类选项中的协方差矩阵选择可以考虑采用Separete-groups,以检验采用Within-groups和Separate-groups两种协方差所得出的结果是否存在显著性差异。如果存在显著性差异,就应该采用Separate-groups两种协方差所得出的结果是否存在显著性差异。如果存在显著性差异,就应该采用Separate-groups协方差矩阵;反
文档评论(0)