《数学地质》6讲(11,12,13) 判别分析.docVIP

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《数学地质》6讲(11,12,13) 判别分析

第11,12,13课 判别分析(Discriminant Analysis) 讲五个问题: 什么是判别分析; 费歇准则下的二组判别分析; 贝叶斯多组判别分析; 多组逐步判别分析; 问题讨论和实例。 一、什么是判别分析 概念:判别分析是一种判别样品所属类型的统计方法。 思想:根据已知类型的样品,按其特征,构造一个判别函数,定出划分类型的界线,并对新样品所属类型进行判别(也可对已知类型的样品进行判别检验)。 类型:若判别类型是两个时,称两组判别分析。如油层、水层;有矿、无矿等。若判别的类型是两个以上时称多组判别分析。如油层、气层、水层;泥岩、砂岩、灰岩等。 原则:两组判别分析是在fisher意义下求解,多组判别是在Bayes意义下求解。 原理:见如下几何图形所示: 当P=2时: 当在P维时: —综合指标,是的线性函数,也有非线性的。 式中:—判别系数。 应用: 判别和检验样品的所属类型; ◆评价,如岩体评价,区别海相或陆相砂岩,区别含油层或含水层。鉴别矿物、岩石类型和古生物的种属; ◆地层和岩相的划分; ◆解释砂体的构造背景,区别沉积条件和环境,火山构造类型等。 二、两组判别分析—Fisher准则 前提条件:A、B两类总体,A组取了个样品,B组取了个样品,每个样品测定了P个指标,原始数据见教材。 1、求线性判别函数y 式中:—待定系数 —指标 问题的关键是如何求得,使得A、B两组分的很清楚,即要得到值,使得A、B区分开。 原则:Fisher:类间差别要大,类内差别要小。 综合指标 A类 (个样品) 综合指标 B类 (个样品) A类样品用 ——代表 = A类样品用 ——代表 = A类内差别为: B类内差别为: 类内差别为: 类间差别为: Fisher准则:使达到极大,求出。即: 根据数学分析中求极值原理,即使: 即得: 因: 式中: 式中: 有: 将两式代入原式得: 令:, 则: (j=1,2,…,p)] 即为P阶线性方程组。 方程组右端是一个常数因子,它对方程组的解只取扩大倍的作用,故取=1将方程组写成矩阵形式,即有: (即:) 此时有: 即得到线性判别函数: 2、判别 计算:——A类代表 ——B类代表 ——判别指标 判别: 若,则时,属于A类。,则属于B类。 3、检验 (1)对判别函数的检验。 计算一个马哈拉诺比斯(Mahalanobis)距离。 统计量为: 对给定的,若: ,则认为判别函数是显著的,反之不显著。 (注:显著则说明P个指标能够分辨A、B两个总体) (2)对各个判别指标的检验。 因为是有由P项构成的,因此第K项在中所占的比重,就代表了第K个指标对总距离的贡献,即大,则说明贡献大,反之,贡献小。 先算出 再求出各指标的贡献: 4、应用实例(见P139—例1) 习题:P(五)二十一 1 第12课 三、多组判别分析 1、什么是多组判别分析 问题的提出: 实际工作中需要对多种类型的样品进行判别,如:油层、气层、水层、干层等,这就需要多组判别分析来解决了。 设有m个总体,第g个总体的样品个数为(g=1,2,…,m),每个样品测定了P个指标,此时,可写成: ——第g类,第j个样品第k个指标的观测值。 原始数据可写成: 总共取了N个样品, 现有一新样品,,试判别它属于已知m类的哪一类。 分析: 仿两组判别,求出判别函数,两组求一个判别函数,三组就要求三个判别函数(即:1~2;2~3;1~3);四组就要求6个,一般地说,若有m组,就要求,这样计算量太大,对一个新样品也得计算多个判别值,比较起来,十分困难。因此,求判别函数的方法对多组判别不适用。 在多组判别分析中,我们是这样考虑的。在判别中,我们可能犯这样的错误,即把本应属于g组的样品错分到n组,或者把n组的样品错分到了g 组,这种错误是在所难免的,我们只希望由此造成的平均损失尽可能的小。平均损失最小的准则称为Bayes准则。 平均损失最小用左图解释: 解释:小圆对第1类来说,错分的损失等于0,而对2,3类就不等与0,要找出一种划分法,使得平均错分的损失为最小。 2、Bayes准则 贝叶斯准则就是计算样品y属于各组的概率 (g=1,2,…,m),然后比较这m个概率的大小,将样品y归于最大的那一组。 根据贝叶斯公式,样品y属于第g组的后验概率(条件概率)为: 式中: —第g组的先验概率,其估计值为: —样品y在第g组的概率密度。 要计算关键是要知道y在各总体的概率密度。 3、正态总体的判别 设m个总体均服从P维正态分布,即: —第g个总体的期望; —第g个总体的协方差。 于是第g个总体的概率密度为: 式中: —的逆矩阵。 设

文档评论(0)

cgtk187 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档