判别分析及其SPSS实现.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
判别分析及其SPSS实现

判别分析及其SPSS实现 信科061班 张志军 摘要: 本文给出判别分析的提出,其基本思想和主要目的,并给出了判别分析最主要的三种基本方法--距离判别法,Bayes判别法和Fisher判别法,阐述了三者之间的内在联系,,给出SPSS中Fisher判别法、非标准化判别法所对应的函数表达式,它们与3种判别法的关系。用例子验证所得的结论,说明利用SPSS中的判别分析方法进行3种判别分析的具体过程。 关键词:判别分析 SPSS 距离判别法 Bayes判别法 Fisher判别法 在日常生活和工作实践中,常常会遇到一类问题,即根据已有的划分类别的有关历史资料,确定一种判别方法,判定一个新的样本归属哪一类。例如在经济研究中要根据人均国民收入、人均工农业产值、人均消费水平等多项指标判别一个国家经济发展所属类别(发达国家、中等发达、发展中国家等) ;在地质勘探中,根据岩石标本的多种特征来判别地层的地质年代,由采样分析出的多种成分来判别此地是有矿还是无矿,是铜矿还是铁矿; 在医疗实践中,要根据就诊者的多种体检指标(如体温、血压、脉搏、白血球等)来判别此人有病还是无病,是这种病还是那种病。因此,判别分析是一种常用的多元统计分析方法。 判别分析的假设条件: 判别分析最基本的要求是,分组类型在两组以上;在第一阶段工作时每组案例的规模必须至少在一个以上;解释变量必须是可测的,才能够计算其平均值和方差,使其能够合理地应用于统计函数。 判别分析的假设之一,是每一个判别变量不能使其他判别变量的线性组合。判别分析的假设之二,是各组矩阵的协方差矩阵相等。 判别分析的假设之三,是各判别变量之间具有多元正态分布,即每个变量对于其他所有变量的固定值有正态分布。 判别分析的主要目的是识别一个个体所属类别的情况下有着广泛应用。潜在的应用包括预测新产品的成功或失败、决定一个学生是否被录取、按职业兴趣对学生分组、确定某人信用风险的种类或者预测一个公司是否成功。在每种情况下,将对象进行分组,并且可以通过人们选择的解释变量来预测或者解释每个对象所属的类别。 最常见的判别分析方法是距离判法,Bayes判别法和Fisher判别法。这3种方法产生的背景是不同的,使用的条件也是不同的。它们的共同特点是计算量很大,若样品的个数或变量,的个数较多时,要想用手算或计算器均难以进行。因此必须使用统计软件才能有效地进行判别分析。本文通过分析比较,首先给出距离判别法, Bayes判别法和Fisher判别法;其次给出SPSS中的Fisher判别和非标准化判别对应的线性函数,它们与3种判别法的关系;最后用例子验证所给出的结论,通过例子说明利用SPSS中的判别分析方法进行距离判别分析、Bayes判别分析和Fisher判别分析的具体过程。 1. 3种判别法及其内在联系 设有k个 m 维总体π1,π2,…,πk ,它们的均值分别为μ1,μ2,…,μk ,协方差矩阵分别是Σ1=Σ2=…=Σk=Σ 0 。现有m 维样品x ,该样品x应归 于哪个类别? 3种判别方法的判别法则分别是: (1)多总体的距离判别法 先计算x与各总体的马氏距离: (x,)=(x-)′Σ(x-) =x′Σx - 2′Σx + ′Σ,i=1,2,…,k; 距离判别法的判别规则是: x ∈ πj , 若 (1) (2)多总体的Bayes判别法 设样品x来自k个总体π1,π2,…,πk的先验概率分别为p1,p2,…,pk,各总体的密度函数分别为f1 ( x) , f2 ( x) ,…, fk ( x) 。若有πi ~ Nm ( ,Σ) , i=1,2,…,k; 这时Bayes判别准则是: x,若+ln= (2) (3)多总体的Fisher判别法 设=,B=,多总体的Fisher判别准则是:对样品x, x ,若= (3) ,若前r个判别函数( r s) 已足够反映m 个原始变量的变化(例如贡献率在85%以上) ,则只需利用前r个判别函数进行判别。对于样品x ,这时判别规则是: x ,若= (4) 或x ,若= (5) 式(5)给出对应于SPSS中Fisher线性判别的一种方法:非标准化法。 在SPSS中选“非标准化函数”后所得表格是判别式(5)中:的系数列向量和常数,i=1,2,…,r。由于这时变量x是非标准化的,故得其名。SPSS中给出各组的中心是 =,i=1,…,s , j=1,…,r 。这样处理在r = 1时使用特别方便,我们将在例子中说明这种方法的使用。 在SPSS中选择Fisher判别法后所得的线性函数是:(x) = x + + ln i = 1, 2, ?, s 。其中 = , = -12 。这里 是由SPSS中先验概率的选择确定的:要么是相等,要么与组容量成比例。若取先验概率p1 = p2 =

文档评论(0)

18273502 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档