06.判别分析.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
06.判别分析

第六章 判别分析 判别分析是判别样品所属类型的一种统计方法,是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类。 在自然界中,经常遇到对研究对象进行分类的问题。分类包括两个方面的内容:其一,是研究对象存在着几种类型,即能分为多少类;其二,在研究对象类型数目已知的情况下,某一研究个体应该属于哪一类。后者,属于判别分析研究的范畴。 判别分析最早(1936)是由英国学者R.A费歇(Fisher)提出的,六十年代初引进地质学。 地质学中遇到的分类问题很多。例如,根据岩矿鉴定,分辨某一砂岩属于海相砂岩或陆相砂岩;在油田开发中,根据钻井的点测或化验数据,判别是否遇到油层、水层或干层;在地球化学中,根据岩体的化验数据,分辨岩体是否是含矿岩体;在煤田勘探中,根据煤层煤质的数据,判别某一勘探区的某一煤层,属于相近勘探区同一煤系诸煤层的哪一层等。 诸如此类的问题,在传统地质学中,多是只管的定性判断,往往随地质人员实践经验不同,得出不同的结论。因此,具有较大的主观性和片面性。运用判别分析方法,对比较复杂、地质变量多、地质属性比较近似的问题,能够给出定量的合理判别。 判别分析的基本思想,是将研究对象(某一个体)的各种地质特征,同它可能归属的各个类型的地质特征进行对比,以决定其应该归入哪一类。为此,判别分析主要解决两个问题: 1、根据什么指标来判别(分辨)已知的类型,即建立判别函数; 2、对于可能来自已知类型的某些未知样品,如何判定它们归属已知类型中的哪一类。 判别分析的具体作法,是在已知类型(如:A、B、C三类)中抽取样本,然后根据每个样品的多个化验指标(变量)经过数学运算处理,建立每一类的判别函数(区分标准),再根据研究对象同样的化验指标与已知类型比较,即将其代入判别函数中,看其与哪一类最接近,就将未知对象归属于哪一类。因此,判别分析就是借助于已知类型的若干变量,建立起一个或多个判别函数,从而决定未知对象归属问题的一种多元统计方法。 2.判别分析与聚类分析 判别分析兼有判别与分类的两种性质,但以判别为主。 判别分析与聚类分析不同之点在于:判别分析必须事先己知分几类为前提;聚类分析则不必事先确定类型,而类型的形成是聚类分析的结果。正因为如此,判别分析和聚类分析往往联合起来使用,例如判别分析是要求先知道各类总体情况才能判断新样品的归类,当总体分类不清楚时,可先用聚类分析对原来的一批样品进行分类,然后再用判别分析建立判别式以对新样品进行判别。 3. 地理研究中判别分析的作用 概括为以下三点: 1) 对已分好的类型进行合理性检验; 2) 判别某地地理类型的归属问题和确定区域界线(两类判别可以用于划分地理区的界线,这时,把界线两边视为不同的类型; 3)评价各要素特征值在判别分析中贡献率的大小。 4. 判别分析的类型 判别分析按判别的级数来区分,有两组判别分析和多组判别分析; 按区分不同总体的所用的数学模型来分,有线性判别和非线性判别; 按判别时所处理的变量方法不同,有逐步判别和序贯判别等。 判别分析可以从不同角度提出问题,因此有不同的判别准则,如马式距离最小准则、Fisher准则、平均损失最小准则、最小平方准则、最大似然准则、最大概率准则等等, 5、判别分析的基本原理 判别分析的基本准则 1)费歇(Fisher)准则 2)贝叶斯(Bayes)准则 1)应用费歇准则进行判别分析时,要对原始地理数据经一定方式进行线性组合,使其形成一个新变量,即判别函数:要使判别函数值能充分地区分开地理类型,就需要使各类均值之间的差别最大(即使不同类之间的差别最大),而使各类内部的离差平方和为最小(即使同类间的差别最小)换句话说,即要求类间(或组间)均值差与类内(或组内)方差之比最大,这样就能把地理类型区分得最清楚。 2)贝叶斯准则是另一种思路的判别标准,而在数学上也是使用了另一种原理和计算过程。当应用贝叶斯准则进行判别分析时.要求把已知的地理数据分成几类(或几组).然后计算出未知地理类型或区域归属于某一已知类型(或组)的概率值,它归属于哪一类的概率值最大,就把它划归该类(或组);另外,还可计算出划归各已知类的错分损失,即错分哪一类的平均损失为最小,就把它判定为该类。 2.费歇(Fisher)准则下的两类判别分析基本原理 1)判别分析的三个假设条件 每一个判别变量不能是其他判别变量的线性组合。 各组协方差矩阵相等。 各判别变

文档评论(0)

qwd513620855 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档