- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
6.判别分析newnew.ppt
判 别 分 析 1.研究背景 第一,为未来的决策和行动提供参考。 例如,以前对一些公司在破产前两年观测到某些重要的金融指标值。现在,要根据另一个同类型公司的这些指标的观测值,预测该公司两年后是否将濒临破产的危险,这便是一种判别,其结论可以帮助该公司决策人员及早采取措施,防止将来可能破产的结局。 例 中小企业的破产模型 为了研究中小企业的破产模型,选定4个经济指标: X1总负债率(现金收益/总负债) X2收益性指标(纯收入/总财产) X3短期支付能力(流动资产/流动负债) X4生产效率性指标(流动资产/纯销售额) 对17个破产企业(1类)和21个正常运行企业(2类)进行了调查,得如下资料: 第二,避免产品的破坏。 例如,一只灯泡的寿命只有将它用坏时才能得知;一种材料的强度只有将它压坏时才能获得。一般地,我们希望根据一些非破坏性的测量指标,便可将产品分出质量等级,这也要用到判别分析。 第三,减少获得直接分类信息的昂贵代价。 例如在医学诊断中,一些疾病可用代价昂贵的化验和手术得到确诊,但通常人们往往更希望通过便于观测(从而也可能导致误诊)的一些外部症状来诊断,以避免过大的开支和对患者不必要的损伤。 第四,在直接分类信息不能获得的情况下可用判别分析。 例如,要判断某未署名的文学作品是否出自某已故作家之手,很显然,我们不能直接去问他。这时可以用这位已故作家署名作品的写作特点(用一些变量描述)为训练样本,用判别分析方法在一定程度上判定该未署名作品是否由该作家所作。 二、判别分析的分类及准则 1.分类 (1)按照判别组数分: 两组判别和多组判别; (2)按照所用的数学模型分: 线性判别和非线性判别; (3)按照处理度量的方法分: 逐步判别和序贯判别。 2.准则 主要有:马氏距离最小准则,Fisher准则,平均损失最小准则,最小平方准则,最大似然准则,最大概率准则。 并可由此提出判别方法:距离判别法,Fisher判别法,Bayes判别法,逐步判别法。 三、判别分析与聚类分析 判别分析是用以判别个体所属群体的一种统计分析方法,产生于20世纪30年代。 判别分析是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知样品进行判别分类。 聚类分析,一批给定样品要划分的类型事先并不知道,正需要通过聚类分析来给以确定类型。 判别分析与聚类分析经常结合使用:通过聚类分析首先确定出几个类型,对难以分类的样品再使用判别分析,确定其类别归属。 §2 距离判别 一、基本思想 二、两个总体的距离判别法 2.判别 判别准则: 这时只需直接计算 通常,一个判别准则的优劣,用它的误判概率来衡量。但只有当总体的分布完全已知时,才有可能精确计算误判概率。下面我们以两个总体为例,介绍两种以训练样本为基础的评价判别准则优劣的方法。 1.貌似误判率方法 通过对训练样本中的各样本逐个回判(即将各样本观测值代入判别准则中进行再判别),利用回判的误判率来衡量判别准则的效果,具体方法如下: 即 2.刀切法 可以证明它是实际误判概率的渐近无偏估计。 刀切法比貌似误判率法要更合理些,但缺点是计算量较大。 五、应用举例 例3.1 P108。 例3.2 P111。 练习:已知某公司人事部门从在该公司已工作五年以上的职工档案中抽出了4人,从在该公司工作不足五年就已离去的人员档案中也抽取了4人,分别列出了每个人在申请工作面试所得的分数和对每个人文化程度的评分,其数据如下: §3 Fisher判别法 这种判别法是历史上最早提出的判别方法之一,也叫线性判别法,该方法对总体的分布无须作出具体的要求。 一、判别原理(基本思想) 二、两总体的Fisher判别 判别准则: 3.计算步骤 3.应用举例 例3.1:教材P121。 §4 贝叶斯判别法 办公室新来了一个雇员小王,小王是好人还是坏人大家都在猜测。按人们主观意识,一个人是好人或坏人的概率均为0.5。坏人总是要做坏事,好人总是做好事,偶尔也会做一件坏事,一般好人做好事的概率为0.9,坏人做好事的概率为0.2,一天,小王做了一件好事,小王是好人的概率有多大,你现在把小王判为何种人。 距离判别简单直观,很实用,但是距离判别的方法把总体等同看待,没有考虑到总体会以不同的概率(先验概率)出现,也没有考虑误判之后所造成的损失的差异。 Bayes判别弥补了这些缺陷,其判别效果更加
文档评论(0)