- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 判别分析
§6.1 什么是判别分析
判别分析是判别样品所属类型的一种统计方法,其应用之广可与回归分析媲美。
在生产、科研和日常生活中经常需要根据观测到的数据资料,对所研究的对象进行分类。例如在经济学中,根据人均国民收入、人均工农业产值、人均消费水平等多种指标来判定一个国家的经济发展程度所属类型;在市场预测中,根据以往调查所得的种种指标,判别下季度产品是畅销、平常或滞销;在地质勘探中,根据岩石标本的多种特性来判别地层的地质年代,由采样分析出的多种成份来判别此地是有矿或无矿,是铜矿或铁矿等;在油田开发中,根据钻井的电测或化验数据,判别是否遇到油层、水层、干层或油水混合层;在农林害虫预报中,根据以往的虫情、多种气象因子来判别一个月后的虫情是大发生、中发生或正常; 在体育运动中,判别某游泳运动员的“苗子”是适合练蛙泳、仰泳、还是自由泳等;在医疗诊断中,根据某人多种体验指标(如体温、血压、白血球等)来判别此人是有病还是无病。总之,在实际问题中需要判别的问题几乎到处可见。
判别分析与聚类分析不同。判别分析是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类。对于聚类分析来说,一批给定样品要划分的类型事先并不知道,正需要通过聚类分析来给以确定类型的。
正因为如此,判别分析和聚类分析往往联合起来使用,例如判别分析是要求先知道各类总体情况才能判断新样品的归类,当总体分类不清楚时,可先用聚类分析对原来的一批样品进行分类,然后再用判别分析建立判别式以对新样品进行判别。
判别分析内容很丰富,方法很多。判别分析按判别的组数来区分,有两组判别分析和多组判别分析;按区分不同总体的所用的数学模型来分,有线性判别和非线性判别;按判别时所处理的变量方法不同,有逐步判别和序贯判别等。判别分析可以从不同角度提出的问题,因此有不同的判别准则,如马氏距离最小准则、Fisher准则、平均损失最小准则、最小平方准则、最大似然准则、最大概率准则等等,按判别准则的不同又提出多种判别方法。本章仅介绍四种常用的判别方法即距离判别法、Fisher判别法、Bayes判别法和逐步判别法。
§6.2 距离判别法
基本思想:首先根据已知分类的数据,分别计算各类的重心即分组(类)的均值,判别准则是对任给的一次观测,若它与第i类的重心距离最近,就认为它来自第i类。
距离判别法,对各类(或总体)的分布,并无特定的要求。
1 两个总体的距离判别法
设有两个总体(或称两类)G、G,从第一个总体中抽取n个样品,从第二个总体中112抽取n个样品,每个样品测量p个指标如下页表。 2?)x?,(X?x,,问今任取一个样品,实测指标值为X应判归为哪一类? p1D(X,G)D(X,G),按距离最近准则首先计算X总体的距离,分别记为和G、G到2121 1
判别归类,则可写成:
X?G,当D(X,G)?D(X,G)?211?X?G,当D(X,G)?D(X,G) ?221?待判, 当D(X,G)?D(X,G)?21G总体: G总体: 21
变变 样样品(2(1))))(1)2((2(1))((1)2xxxxxxxx … … p1p11211211111(1)(2))((2(1))2)1()2(1)(xxxxxxxx pp222222212212 ????????
(2(2(2)))(1))(2)2()1((1)xxxxxxxx … …nn2n1nnPnP2nn1(1)(2)))(1(1)2)(2( 均值… 均值 … xxxxxx pp2121
)((i)(i)i ?,i?1,2?(x,,x)X记? p1如果距离定义采用欧氏距离,则可计算出
??p2 (1)(1)(1)??x?X)??X,G)?(X?X)x(XD( aa11a? ??p2 (2)(2)(2)??xD(X,G)?(X?X?x?(XX?)) aa21a?D(X,G)D(X,G)大小,按距离最近准则判别归类。然后比较 和21由于马氏距离在多元统计分析中经常用到,这里针对马氏距离对上述准则做较详细的讨论。
(1)(2)(1)(2)????分别为、,、G设、G的均值向量和协方差矩阵。如果距离定义采21用马氏距离即
2(i)(i)?1(i)???)i?)G(X,)?(X?1,(X)?(?2D i这时判别准则可分以下两种情况给出:
(1)(2)?????时(1)当
22(X,DG))(XD,G的差,就有:考察及 12??1(2)(2)(2)?22?1
您可能关注的文档
最近下载
- 2022年上海市春季高考语文真题试卷含详解与写作参考范文.docx VIP
- 2023年上海市春季高考语文试卷真题含答案及评分标准.pdf VIP
- 运动会铅球宣传稿.docx VIP
- 《离心机 安全要求gb 19815-2021》详细解读.pdf
- 2025年1月上海市春季高考语文真题(附答案解析).docx VIP
- 2025湖北银行笔试题库及答案.doc VIP
- 2025年上海市高考语文真题试卷及答案.docx VIP
- 《国有企业管理人员处分条例》课件.pptx VIP
- 58同城如何发布房屋出租信息?房屋出租技巧?.doc VIP
- 人教版高中英语必修第一册《UNIT 3 SPORTS AND FITNESS》大单元整体教学设计.docx
文档评论(0)