第7章_判别分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
本章学习目标 a. 掌握地球科学中大量地质对象识别与 归类的思想; b. 学会构造Fisher线性判别函数的基本方法与步骤; c. 了解逐步判别的思路和基本步骤; 学习重点、难点 重点 不同判别分析技术的正确选取和判别函数的求法 难点 根据实际观测数据构建判别函数和具体实现; 判别分析 课时安排 6学时,课外完成习题 学习方法 讲授与课堂讨论 背景知识 相关的专业知识 概率论与数理统计 问题: 已知某地质对象的分类,今有不知具体来源的对象需要根据其指标特征进行归类,即判别它属于哪一类型?以便进一步对其进行相应的预测和控制分析。 如果各协方差阵相同,即V1= V2=…=Vm=V, 此时(7-8)式变为 实际工作中用样本均值xg来估计μg,用样本 协方差阵S来估计V。 于是 贝叶斯条件概率公式变为: 我们关心的是其中概率最大者,由上式可知,要使p{g/Y}达最大,只要分子最大即可。于 是,我们对上式分子取自然对数: 将上式与g有关的项记为Fg(Y),即 显然,Fg(Y)是y1,y2,…,yp的m个线性函数,当Fg(Y)在某组取得最大值时,P{g/Y}在该组亦达到最大,样品有Y就归于取得最大值的一组。因此,称Fg(Y)为判别函数。 利用矩阵的计算形式,将上式写为 其中 贝叶斯多组判别的计算步骤如下: 1.计算每组各个变量的平均值 2.计算各组的离差阵 3.计算综合协方差矩阵 4.求S的逆阵S-1=[S-1kt]p×p 5.计算判别函数并对样品Y=(y1,y2,…,yp) 作判别归类,计算出各判别函数Fg(Y) (g=1,2,…,m)的值,找出其中最大者: 将样品Y归于第g组。 6.计算样品Y属于g组(g=1,2,…,m)的后验 概率 7.将原有的分组样品代入判别函数进行回判, 算出判对率,以检验判别的有效性。 例:江汉油田13个油层、11 个水层、7个油 水层的测井资料得到岩性系数x1,孔隙度x2, 浸入系数x3,含油饱和度x4统计如下表: (1)计算每组各变量的均值 x11=0.2876 x12=0.2278 x13=1.3294 x14=0.6538 x21=0.4618 x22=0.2195 x23=4.6954 x24=0.3268 x31=0.4199 x32=0.2200 x33=3.0600 x34=0.5757 (2)计算协方差矩阵S并求出其逆矩阵S-1,结 果为 (3)计算各组判别函数。以计算第一组判别 函数为例,计算过程用矩阵形式给出: 于是得第一组的判别函数为 F1(Y)=-0.8690+22.5y1+88.24y2+0.8614y3+ 62.35y4-33.372 =22.5y1+88.24y2+0.8614y3+62.35y4-34.241 仿此可求出第二组与第三组的判别函数 F2(Y)=45.55y1+113.41y2+1.078y3+21.13y4-28.952 F3(Y)=36.261y1+93.954y2+1.103y3+51.67y4-34.379 * * 第七章 判别分析 第一节 判别分析的思想 判别分析的主要思想就是用统计方法将待判的未知样品与已知类型样品进行类比,以确定待判样品应归属于哪一类。 矿产预测、地球化学分析、石油及天然气地质中都有大量的判别类型的问题,如判别岩石类型、地层时代、古生物种属、判别钻井穿过的层位的含油性、判别沉积相、判别地层的生油条件等 直线L上的计量y是x1与x2两个变量的一个线 性组合: y=c1x1+c2x2 1. 线性判别函数 双变量: y=c1x1+c2x2 多变量:R=c1x1+c2x2+…+ckxk 2. 非线性判别函数 双变量: y=c1x1+c2x22 或 y=c1x12+c2x2 多变量:R=c1x1i+c2x2i+…+ckxki i=1,为线性判别函数 i=2,为非线性函数 对于有k个因素线判别函数 R=c1x1+c2x2+…+ckxk 它必须满足以下条件: (1)样品的指标服从多元正态分布; (2)多元正态分布的协方差矩阵相等; (3)两类错误的概率相等(α=β)。 判别方法: 1.根据Fisher准则得出的Fisher判别; 2.根据Bayes准则得出的Bayes判别. 第二节 二级判别分析(Fisher准则) 一、线性判别函数的确定原则(判别模型) 设有A、B两类总体,A类总体有n1个样品, B类总体有n2个样品。每个样品都测定了k个指 标,分别记为 x1t(A),x2t(A), …,

文档评论(0)

beoes + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档