判别分析newnew资料.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
判别分析newnew资料.ppt

判 别 分 析 1.研究背景 在工业生产中,要根据某种产品的一些非破坏性测量指标判别产品的质量等级; 在经济分析中,根据人均国民收入,人均工农业产值,人均消费水平等指标判断一个国家的经济发展程度; 在考古研究中,根据挖掘的古人头盖骨的容量,周长等判断此人的性别; 在地质勘探中,根据某地的地质结构,化探和物探等各项指标来判断该地的矿化类型; 在医学诊断中,医生要根据某病人的化验结果和病情征兆判断病人患哪一种疾病。 2.基本思想及意义 在实际应用中,通常由取自各总体的关于指标的样本为该总体的代表,该样本称为训练样本。 判别分析即提取训练样本中各总体的信息以构造一定的准则来决定新样本观测值的归属问题。 训练样本往往是历史上对某现象长期观测或者是用昂贵的试验手段得到的,因此对当前的新样本观测值,我们自然希望将其指标值中的信息同各总体训练样本中的信息作比较,使可在一定程度上判定新样本观测值的所属类型。 概括起来,下述几个方面体现了判别分析的重要意义: 第一,为未来的决策和行动提供参考。 例如,以前对一些公司在破产前两年观测到某些重要的金融指标值。现在,要根据另一个同类型公司的这些指标的观测值,预测该公司两年后是否将濒临破产的危险,这便是一种判别,其结论可以帮助该公司决策人员及早采取措施,防止将来可能破产的结局。 例 中小企业的破产模型 为了研究中小企业的破产模型,选定4个经济指标: X1总负债率(现金收益/总负债) X2收益性指标(纯收入/总财产) X3短期支付能力(流动资产/流动负债) X4生产效率性指标(流动资产/纯销售额) 对17个破产企业(1类)和21个正常运行企业(2类)进行了调查,得如下资料: 第二,避免产品的破坏。 例如,一只灯泡的寿命只有将它用坏时才能得知;一种材料的强度只有将它压坏时才能获得。一般地,我们希望根据一些非破坏性的测量指标,便可将产品分出质量等级,这也要用到判别分析。 第三,减少获得直接分类信息的昂贵代价。 例如在医学诊断中,一些疾病可用代价昂贵的化验和手术得到确诊,但通常人们往往更希望通过便于观测(从而也可能导致误诊)的一些外部症状来诊断,以避免过大的开支和对患者不必要的损伤。 第四,在直接分类信息不能获得的情况下可用判别分析。 例如,要判断某未署名的文学作品是否出自某已故作家之手,很显然,我们不能直接去问他。这时可以用这位已故作家署名作品的写作特点(用一些变量描述)为训练样本,用判别分析方法在一定程度上判定该未署名作品是否由该作家所作。 从以上例子也可以清楚地看到,如果不是利用直接明确的分类信息来判断某样本观测值的归属问题,难免会出现误判的情况。 判别分析的任务是依据训练样本所提供的信息,建立在某种意义下最优(如误判概率最小,或误判损失最小等)的准则来判定一个新样本属于哪一个总体。 根据判别准则的不同,我们主要介绍距离判别、Fisher判别和Bayes判别。 二、判别分析的分类及准则 1.分类 (1)按照判别组数分: 两组判别和多组判别; (2)按照所用的数学模型分: 线性判别和非线性判别; (3)按照处理度量的方法分: 逐步判别和序贯判别。 2.准则 主要有:马氏距离最小准则,Fisher准则,平均损失最小准则,最小平方准则,最大似然准则,最大概率准则。并可由此提出判别方法:距离判别法,Fisher判别法,Bayes判别法,逐步判别法。 三、判别分析与聚类分析 判别分析是用以判别个体所属群体的一种统计分析方法,产生于20世纪30年代。判别分析是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知样品进行判别分类。 聚类分析,一批给定样品要划分的类型事先并不知道,正需要通过聚类分析来给以确定类型。 判别分析与聚类分析经常结合使用:通过聚类分析首先确定出几个类型,对难以分类的样品再使用判别分析,确定其类别归属。 §2 距离判别 一、基本思想 二、两个总体的距离判别法 2.判别 判别准则: 这时只需直接计算 通常,一个判别准则的优劣,用它的误判概率来衡量。但只有当总体的分布完全已知时,才有可能精确计算误判概率。下面我们以两个总体为例,介绍两种以训练样本为基础的评价判别准则优劣的方法。 1.貌似误判率方法 当利用各总体的训练样本构造出判别准则后,评价此准则优劣的一个可行的办法是通过对训练样本中的各样本逐个回判(即将各样本观测值代入判别准则中进行再判别),利用回判的误判率来衡量判别准则的效果,具体方法如下: 即 2.刀切法 可以证明它是实际误判

文档评论(0)

love + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档