数理统计作业1三中判别分析最新.doc

下载文档

20
0
约3.47万字
约 71页
2018-01-18 发布于山东
举报
版权申诉
保障服务

数理统计作业1三中判别分析最新.doc

1、本文档共71页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

作业一一、人文发展指数是联合国开发计划署于1990年5月发表的第一份《人类发展报告》中公布的。该报告建议，目前对人文发展的衡量应当以人生的三大要素为重点，衡量人生三大要素的指示分别采用出生时的预期寿命、成人识字率和实际人均GDP，将以上三个指示指标的数值合成为一个复合指数，即为人文发展指数。资料来源UNDP《人类发展报告》1995年。今从1995年世界各国人文发展指数的排序中，选取高发展水平、中等发展水平的国家各五个作为两组样品，另选四个国家作为待判样品作判别分析。使用距离判别方法进行判别，并进行研究三者之间的关系。一、距离判别法解：变量个数p＝3，两类总体各有5个样品，即n1＝n2＝5 ，有4个待判样品，假定两总体协差阵相等。由spss可计算出：协方差和平均值知道了均值和协方差可利用matlab计算线性判别函数W（x）v=[15.380,21.713,-555.875;21.713,66.613,-1446.098;-555.875,-1446.098,262546.500]; m1=[75.88;94.12;5343.4];m2=[70.44;91.74;3430.2]; m=(m1+m2)/2; arfa=inv(v)*(m1-m2) arfa = 0.6507 0.0133 0.0087 c=arfa*m c = 87.1774 则：则将待判样品带入判别方程中得： -24.5071 -15.5847 10.2951 4.1921 故可知：中国和罗马尼亚属于第二类，而希腊和哥伦比亚属于第一类。二、Fisher判别方法 1、操作步骤：录入数据，选择菜单项Analyze→Classify→Discriminate，打开Discriminate Analysis对话框，如图2-1。图2-1 单击Statistics按钮，在跳出的Statistics子对话框中指定输出的描述统计量和判别函数系数。如图2-2 如图2-2 单击Classify按钮，打开Classification子对话框，对它的先验概率、输出以及图等的选择。如图2-3 如图2-3 单击Save按钮，打开Save子对话框，如图2-4，指定在数据文件中生成代表判别分类结果和判别函数值的新变量。如图2-4 单击‘OK’即可。 2、结果分析表2-1是Fisher判别函数的特征值表。特征值为相应Fisher判别函数的特征值，等于判别函数值组间平方和与组内平方和之比，该值越大表明判别函数效果越好。特征值的个数与Fisher判别函数的个数相等，由于本例中总体只有两类，所以至多有一个Fisher判别函数。正则相关性为典型相关系数，等于组间平方和与组内平方和之比的平方根。表2-1 Fisher判别函数特征值表2-2给出了Fisher判别函数有效性检验结果。该检验的原假设是不同组的平均Fisher判别函数值不存在显著差异。从表中给出的值来看，说明在0.05的显著性水平下有理由拒绝原假设，即应认为不同组的平均Fisher判别函数值存在显著差异，这意味着判别函数是有效的。表2-2 Fisher判别函数有效性检验表2-3和表2-4分别给出了标准化的Fisher判别函数和未标准化的Fisher判别函数。标准化的Fisher判别函数是由标准化的自变量通过Fisher判别法得到的，所以要得到标准化的Fisher判别函数值，代入该函数的自变量必须是经过标准化的。而未标准化的Fisher判别函数系数由于可以将实测的样品观测值直接代入求出判别函数值，所以该系数使用起来比标准化的系数要方便一些。由表2-4可知，Fisher判别函数为：表2-3 表2-4 第一类，即属于高发展水平国家的各项指标均值：（75.88,94.12,5343.4）第二类，即属于中等发展水平国家的各项指标均值：（70.44,91.74,3430.2）代入判别函数可得： =2.54188 =-2.075 由此可得临界值：将样本一（中国）的数据代入判别函数得： =-5.3521 ，故中国属于第二类即中等发展水平国家。将样本二（罗马尼亚）的数据代入判别函数得： = -3.3177 ，故罗马尼亚属于第二类即中等发展水平国家。将样本三（希腊）的数据代入判别函数得： =2.5678 ，故希腊属于第一类即属于高发展水平国家。将样本四（哥伦比亚）的数据代入判别函数得： = 1.2121 ，故哥伦比亚属于第一类即属于高发展水平国家。表2-5可知，在这次判别中并没有误判情况，即是误判的概率为0。表2-5 三、Bayes判别法 1、操作过程录入数据，选择菜单项Analyze→Classif