- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
zf zf 第7章 判别分析 (Discriminate Analysis) 7.1 判别分析的基本思想 一、什么是判别分析? 判别分析 根据已知对象的某些观测指标和所属类别来判断未知对象所属类别的一种统计学方法。 如何判断(判断依据)? 利用已知类别的样本信息求判别函数,根据判别函数对未知样本所属类别进行判别 判别分析的特点(基本思想) 1、是根据已掌握的、历史上若干样本的p个指标数据及所属类别的信息,总结出该事物分类的规律性,建立判别公式和判别准则。 2、根据总结出来的判别公式和判别准则,判别未知类别的样本点所属的类别。 判别分析的目的:识别一个个体所属类别 判别分析的应用:无处不在 医学: 例1:在医学诊断中,一个病人肺部有阴影,医生要判断他患的是肺结核、肺部良性肿瘤还是肺癌? 肺结核病人、肺部良性肿瘤病人、肺癌病人组成三个总体,病人来自其中一个总体,可通过病人的指标(阴影大小、边缘是否光滑等)用判别分析判断他来自哪个总体(即判断他患的什么病?) 经济学: 例2:中小企业的破产模型 为了研究中小企业的破产模型,选定4个经济指标: X1总负债率(现金收益/总负债) X2收益性指标(纯收入/总财产) X3短期支付能力(流动资产/流动负债) X4生产效率性指标(流动资产/纯销售额) 对17个破产企业(1类)和21个正常运行企业(2类)进行了调查,得相关资料,并构建判别函数。 例3:根据信息基础设施的发展状况,对世界20个国家和地区进行分类。 考察指标有6个: 1、X1:每千居民拥有固定电话数目 2、X2:每千人拥有移动电话数目 3、X3:高峰时期每三分钟国际电话的成本 4、X4:每千人拥有电脑的数目 5、X5:每千人中电脑使用率 6、X6:每千人中开通互联网的人数 分析结果:将20个国家分为两类 第1类(基础设施落后):巴西、墨西哥、波兰、匈牙利、智利、俄罗斯、泰国、印度、马来西亚 第2类(基础设施发达):瑞典、丹麦、美国、中国台湾、韩国、日本、德国、法国、新加坡、英国、瑞士 如果:我们想知道我国基础设施发展属于哪一类型? 运用判别分析 依据:20个国家的分类信息构建判别函数 3、判别分析和聚类分析往往联合使用。当总体分类不清楚时,先用聚类分析对一批样本进行分类,再用判别分析构建判别式对新样本进行判别。 此外判别分析变量情况: 被解释变量为属性(定类)变量; 解释变量是定量变量。 四、判别分析类型及方法 (1)按判别的组数来分,有两组判别分析和多组判别分析 (2)按区分不同总体所用的数学模型来分,有线性判别和非线性判别 (3)按判别对所处理的变量方法不同有逐步判别、序贯判别。 (4)按判别准则来分,有费歇尔判别准则、贝叶斯判别准则。SPSS的判别分析的输出结果以费歇尔判别为主。 7.2 距离判别 基本思想: 即:首先根据已知分类的数据,分别计算各类的重心即各组(类)的均值,判别的准则是对任给样品,计算它到各类重心的距离,哪个距离最小就将它判归哪个类。 7.3费歇尔(Fisher)判别 所谓Fisher判别法,就是用投影的方法将k个不同总体在p维空间上的点尽可能分散,同一总体内的各样本点尽可能的集中。用方差分析的思想则可构建一个较好区分各个总体的线性判别法。 两类Fisher判别示意图 两类Fisher判别示意图 (一)基本思想 设有A、B两个总体,分别有 个历史样本数据,每个样本有P个观测指标,每个样本可看作P维空间中的一点。Fisher借助于方差分析的思想构造一个线性判别函数: 其中,判别系数 的选择应使得y值满足: (1)A类和B类的样本点群尽可能远离; (2)同一类的样本点尽可能集中。 (二)Fisher两类判别的计算步骤: 1、输入历史数据,计算 和 2、计算 3、解方程组 ,求出 ,建立判别函数 4、对新样本作判别 (1)将新样本p个观测值带入判别函数,求出y值 (2)确定临界值,做出判断。 7.4 判别分析实例 SPSS的判别结果 ⑴ 指定分组变量及其取值范围。 将分组变量从源变量窗口通过选择箭头选到分组变量窗口“Grouping variable”。并从“Define Range”按钮定义分组变量的取值范围,给定最小值M
文档评论(0)