spss教程131(判别分析).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
判别分析 距离判别法 费歇尔判别法 逐步判别法 判别分析 判别分析是根据观察或测量到若干变量值,判断研究对象如何分类的方法。 判别分析 判别分析 分类: 1、按判别的组数来分,有两组判别分析和多组判别分析 2、按区分不同总体所用的数学模型来分,有线性判别和非线性判别 3、按判别对所处理的变量方法不同有逐步判别、序贯判别。 4、按判别准则来分,有费歇尔判别准则、贝叶斯判别准则 判别分析 判别分析和前面的聚类分析有什么不同呢? 主要不同点就是,在聚类分析中一般人们事先并不知道或一定要明确应该分成几类,完全根据数据来确定。 而在判别分析中,至少有一个已经明确知道类别的“训练样本”,利用这个数据,就可以建立判别准则,并通过预测变量来为未知类别的观测值进行判别了。 费歇尔判别法 费歇尔判别方法是历史上最早提出的判别方法之一,也叫线性判别法 费歇尔判别的思想是通过将多维数据投影到某个方向上,投影的原则是将类与类之间尽可能的分开,然后再选择合适的判别准则,将待判的样本进行分类判别。 费歇尔判别法 一、判别原理 设有k个总体G1,G2,…,Gk,每类中含有样本数分别为n1,n2,…,nk 假定所建立的判别函数为 费歇尔判别法 费歇尔方法就是要找一由p变量组成的线性函数,使得各组内点的函数值尽可能接近,而不同组间的函数值尽可能远 费歇尔判别法 对于待判样本,计算 和 若 , 则x属于第k组 逐步判别分析 一、逐步判别原理 逐步判别分析从模型没有变量开始,每一步都对模型进行检验,把模型外对模型的判别力贡献最大的变量加到模型中,同时考虑已经在模型中但又不符合留在模型中条件的变量从模型中剔除。 逐步判别分析 二、选择变量方法 1、Wilk’s λ最小法 2、Rao’V最大法 3、马氏距离最大法 4、F统计量最大法 5、剩余离差平方和最小法 Wilk’s λ最小法 U统计量 λ=组内平方和/总平方和,每一步都是统计量最小的进入判别函数 容许度=1-Ri2 (Ri2为偏相关系数) Rao’V最大法 每步都是使RaoV统计量产生最大增量的变量进入判别 函数 P—模型中的变量数,g—分类数,nk—第k组样本大小,Wij*—组间协方差矩阵的逆矩阵 V—两组均值之差 组间的F检验 判别分析的基本步骤: 1、选择自变量及组变量 2、计算各组单变量的描述统计量 3、推导判别系数,给出标准化或未标准化的典则判别系数,并对函数显著性进行检验 4、建立Fisher线性判别函数 5、进行判别分组 6、进行样本回判分析,计算错分率 7、输出结果 距离判别法 马氏距离: * * 判别分析 设有k个总体 分布函数分别为 从每个总体 中抽取 个样品,每个样品测量 )。 个指标 对于任一给定的新样本观测值关于指标 的观测值 判断该样本观测值应属于这k 个总体中的哪一个 判别分析 例如,在考古研究中,根据挖掘的古人头盖骨的容量,周长等判断此人的性别;在地质勘探中,根据某地的地质结构,化探和物探等各项指标来判断该地的矿化类型;在医学诊断中,医生要根据某病人的化验结果和病情征兆判断病人患哪一种疾病,等等 a b a表示p维空间的一个方向,如果按这个方向做一条直线, 表示向量x在这条直线上投影坐标 2 判别函数 费歇尔判别法 费歇尔判别法 费歇尔判别法 费歇尔判别法 标准化判别函数 典则相关系数 费歇尔判别法 类型总体投影均值之间的相等性检验 Wilk’s λ量 3 判别准则 每步都使任何两类间的最小的F值最大的变量进入判别函数 判别分析的适用条件: 1 各自变量为连续型或有序分类变量 2 样本来自多元正态总体 3 各组的协方差矩阵相等 4 变量间独立,无共线性 具体操作 Statistics→Classify →Discriminant: Grouping Variables:选择分类变量 Define range:定义范围 Independent:选择自变量 Use stepwise method 逐步判别 Select: 选择观测值,一般可省略 具体操作 Statistics: 输出统计量 Descriptives:描述统计量 Means:各类中各自变量均值,标准差 和各自变量总样品的均值,标准差 Univariate ANOVAS:检验各类中同一自变量 均值是否相等 Box’M:检验各组协差阵是否相等 Functio

文档评论(0)

liudao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档