[数学]第七讲 判别分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[数学]第七讲 判别分析

第七讲 判别分析 例 中小企业的破产模型 为了研究中小企业的破产模型,选定4个经济指标: X1总负债率(现金收益/总负债) X2收益性指标(纯收入/总财产) X3短期支付能力(流动资产/流动负债) X4生产效率性指标(流动资产/纯销售额) 对17个破产企业(1类)和21个正常运行企业(2类)进行了调查,得如下资料: 聚类分析数据格式 一、判别分析数据格式 判别分析利用已知类别的样本培训模型,为未知样本判类的一种统计方法。 它产生于20世纪30年代。近年来,在自然科学、社会学及经济管理学科中都有广泛的应用。 判别分析的特点是根据已掌握的、历史上每个类别的若干样本的数据信息,总结出客观事物分类的规律性,建立判别公式和判别准则。然后,当遇到新的样本点时,只要根据总结出来的判别公式和判别准则,就能判别该样本点所属的类别。 聚类分析与判别分析间的联系 二、判别分析方法 研究判别分析的方法很多,不同的研究方法有不同的分类: 1、按判别的组数来分,有两组判别分析和多组判别分析 2、按区分不同总体所用的数学模型来分,有线性判别和非线性判别 3、按判别对所处理的变量方法不同有逐步判别、序贯判别。 4、按判别准则来分,有费歇尔判别准则、贝叶斯判别准则、最小平方准则、最大似然准则。 用数学的语言来说,判别问题可以表述为:对于m类总体G1,G2,……,Gm,其分布函数分别为f1(y),f2(y),…… fm(y),对于一个给定样品y,我们要判断出这个样本来自哪个总体。判别分析的主要问题就是如何寻找最佳的判别函数和建立判别规则。 例如,我们有了患胃炎的病人和健康人的一些化验指标,就可以从这些化验指标发现两类人的区别。把这种区别表示为一个判别公式,然后对怀疑患胃炎的人就可以根据其化验指标用判别公式诊断。 判别函数 从研究角度考虑,我们可以把判别函数分为两大类,最佳型判别函数和固定型判别函数,一个最佳型的判别函数仅根据所采用的判别规则而定,而固定型判别函数的形式是由经验或部分经验选定的,所用的规则仅用来确定判别函数的未知参数。 就函数类型而言,一般的判别函数有两类,即线性函数和非线性函数。比如,对于固定型判别函数,我们可以将其表示为: 在求判别函数的未知参数Ci时,可由各种各样的最优规则,常用的有Fisher准则、Bayes准则、最小二乘准则等。 三、判别分析步骤 定义组 建立判别函数 估计判别函数 检验判别函数(组间最优判别) 检验判别变量(判别变量判别意义检验) 将新元素分类(距离、Fisher、Bayes) 一、距离 欧氏距离 缺陷:①与总体的变异程度有关 ②受量纲变化的影响 马氏距离 在企业的考核中,可以根据企业的生产经营情况把企业分为优秀企业和一般企业。考核企业经营状况的指标有: 资金利润率=利润总额/资金占用总额 劳动生产率=总产值/职工平均人; 产品净值率=净产值/总产值 三个指标的均值向量和协方差矩阵如下: 例3 对28名一级和25名健将级标枪运动员测试了6个影响标枪成绩的训练项目。 分析: 对未定级的14名运动员进行判类。 二、判别的步骤 1、由各组样本资料,计算各组样本均值 2、计算离差矩阵A: 3、计算各组样本离差平方和E 4、计算矩阵E-1 A的前m个特征向量 5、构造判别函数Yl(x)。 6、判断 例1 对28名一级和25名健将级标枪运动员测试了6个影响标枪成绩的训练项目。采用典型判别法 例2 第四节 贝叶斯判别分析 距离判别简单直观,很实用。从距离判别法来看,它存在以下不足: (1)判别方法与总体各自出现的概率的大小无关; (2)判别方法与错判之后所造成的损失无关。 从费歇尔判别法来看,它随着总体个数的增加,建立的判别函数式个数也增加,因而计算起来比较麻烦。 一个好的判别方法,既要考虑到各个总体出现的先验概率,又要考虑到错判造成的损失,Bayes判别就具有这些优点,它是计算新给样品属于各总体的条件概率P(l/x),比较这k个概率的大小,然后将样品判归为来自概率最大的总体,其判别效果更加理想,应用也更广泛。 1、基本思想(最大后验准则) 2、多元正态总体的Bayes判别法 在实际问题中遇到的许多总体往往服从正态分布,下面给出p元正态总体的Bayes判别法。 (1)判别函数的导出 由前面的叙述可知,使用Bayes判别法作判别分析,首先要知道待判总体的先验概率和密度函数。对于先验概率,一般用样品的频率来代替。或者令先验概率相等,这时可以认为先验概率不起作用。 (2)假设协差阵相等 (3)计算后验概率 例1 对

文档评论(0)

skvdnd51 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档