第六章_判别分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
经济管理学院 程兰芳 第6章 判别分析 Discriminate Analysis §6.1 判别分析的基本概念 它是判别一个样品属于哪一种类型的一种统计分析方法 判别分析的应用十分广泛 在生产、科研和日常生活中经常需要根据观测到的数据资料,对研究对象进行类别归属的判定。 1. 在经济学中,根据人均国民收入、人均工农业产值、人均消费水平等多种指标来判定一个国家的经济发展程度所属类型; 2. 在市场预测中,根据以往调查所得的种种指标,判别下季度产品是畅销、平常或滞销; 3. 在地质勘探中,根据岩石标本的多种特性来判别地层的地质年代,由采样分析出的多种成份来判别此地是有矿或无矿,是铜矿或铁矿等; 判别分析的应用十分广泛 4. 在油田开发中,根据钻井的电测或化验数据,判别是否遇到油层、水层、干层或油水混合层; 5.在气象学中,根据已有的气象资料(气温、气压、湿度等)来判断明天是阴天还是晴天。 6.在医疗诊断中,根据某人多种体检指标(如体温、血压、白血球等)来判别此人是有病还是无病。再如,一个病人肺部有阴影,医生要判断他是患肺结核、肺部良性肿瘤还是肺癌? 总之,在实际问题中需要判别的问题几乎到处可见。 判别分析与聚类分析的区别 聚类分析和判别分析有着相似之处,都是用来对样品进行分类,即分析每一个样品归属于哪一类。 但是,判别分析是先已知某些样品的分类结果,然后总结出判别规则,是一种有指导的学习。即:判别分析是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行归类判别。 而聚类分析则是有了一批给定的样品,而要划分的类型事先并不知道,甚至连分成几类也不知道,希望用某种方法把观测进行合理的分类,使得同一类的观测比较接近,不同类的观测相差较多,这是一种无指导的学习。 正因为如此,判别分析和聚类分析往往联合起来使用, 例如,判别分析是要求先知道各类总体情况才能判断新样品的归类,当总体分类不清楚时,可先用聚类分析对原来的一批样品进行分类,然后再用判别分析建立判别式,从而对新样品进行判别。 判别分析的目的是对已知分类的数据建立由数值指标构成的分类规则,然后把这样的规则应用到未知分类的样品去分类。 例如,我们有了患胃炎的病人和健康人的一些化验指标,就可以从这些化验指标发现两类人的区别,把这种区别表示为一个判别公式,然后对怀疑患胃炎的人根据其化验指标用这个判别公式进行诊断。 判别分析适合解决的问题 再例如:一个病人经胸透发现肺部有阴影,而肺结核、肺部肿瘤、肺癌这三种病,肺部都可能有阴影。大夫要依据这一症状以及有关信息,如阴影的大小、阴影的部位、边缘是否光滑、是否咳嗽、是否有痰、是否低烧等项指标,对该病人作出诊断。 但问题是这三种病的症状并没有截然分明的界限,在没有进一步确诊之前,希望用统计推断的方法对其作出尽可能可靠的判断。 判别分析适合解决的问题 又如,根据已知的气象信息,如气温、气压、湿度、云图、风力、风速、风向等来判别明天是晴天还是阴天、是有雨还是无雨,这也是判别问题。 抽象而概括地讲,判别分析的统计模型可以这样来描述: 设有m 个p元总体G1,G2,…,Gm 分别服从一定的分布F1(x), F2(x),…, Fm(x),现在有一个新的p元样品 ,问:它最可能来自于这m个总体中的哪一个。 即,该问题是要依据该样品的p 项指标,判别它最可能来自哪一个总体? 针对上述肺病疾病问题,肺结核、肺肿瘤、肺癌就是三个总体,每一个总体的病人的p项指标都有一定的随机性,那个肺部有阴影的病人就是一个新的样品,已经测得其p项指标 ,需要判断它来自哪个总体,就意味着诊断出他患的是哪一种疾病。 判别分析的内容 判别分析可以从不同角度提出问题,因此有不同的判别准则, 如马氏距离最小准则、Fisher准则、平均损失最小准则、最小平方准则、最大似然准则、最大概率准则等等, 按判别准则的不同又提出多种判别方法。处理判别问题常用的有四种统计方法: 距离判别法、Bayes判别法、Fisher判别法和逐步判别法。 下面进行简要的介绍。 §6.2 距离判别法 基本思想:首先根据已知分好类的数据,分别计算各类的重心,即分组(类)的均值。 判别准则是对任给的一次观测,即一个待判定样品,若它与第i类的重心距离最近,就认为它来自第i 类。 简言之,待判样品与哪一个类(即总体,或称为组)距离最近,就判定它属于哪一个类。 距离判别法,对各类(或总体)的分布,并无特定的要求。 1、 两个总体的距离判别法 设有两个p元总体(或称两类)G1、G2,从第一个总体中抽取n1个样品,从第二个总

文档评论(0)

20010520 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档