- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《数学地质》6讲(11,12,13) 判别分析
第11,12,13课 判别分析(Discriminant Analysis)
讲五个问题:
什么是判别分析;
费歇准则下的二组判别分析;
贝叶斯多组判别分析;
多组逐步判别分析;
问题讨论和实例。
一、什么是判别分析
概念:判别分析是一种判别样品所属类型的统计方法。
思想:根据已知类型的样品,按其特征,构造一个判别函数,定出划分类型的界线,并对新样品所属类型进行判别(也可对已知类型的样品进行判别检验)。
类型:若判别类型是两个时,称两组判别分析。如油层、水层;有矿、无矿等。若判别的类型是两个以上时称多组判别分析。如油层、气层、水层;泥岩、砂岩、灰岩等。
原则:两组判别分析是在fisher意义下求解,多组判别是在Bayes意义下求解。
原理:见如下几何图形所示:
当P=2时:
当在P维时:
—综合指标,是的线性函数,也有非线性的。
式中:—判别系数。
应用:
判别和检验样品的所属类型;
◆评价,如岩体评价,区别海相或陆相砂岩,区别含油层或含水层。鉴别矿物、岩石类型和古生物的种属;
◆地层和岩相的划分;
◆解释砂体的构造背景,区别沉积条件和环境,火山构造类型等。
二、两组判别分析—Fisher准则
前提条件:A、B两类总体,A组取了个样品,B组取了个样品,每个样品测定了P个指标,原始数据见教材。
1、求线性判别函数y
式中:—待定系数 —指标
问题的关键是如何求得,使得A、B两组分的很清楚,即要得到值,使得A、B区分开。
原则:Fisher:类间差别要大,类内差别要小。
综合指标 A类 (个样品) 综合指标 B类 (个样品)
A类样品用 ——代表 =
A类样品用 ——代表 =
A类内差别为:
B类内差别为:
类内差别为:
类间差别为:
Fisher准则:使达到极大,求出。即:
根据数学分析中求极值原理,即使:
即得:
因:
式中:
式中:
有:
将两式代入原式得:
令:, 则:
(j=1,2,…,p)]
即为P阶线性方程组。
方程组右端是一个常数因子,它对方程组的解只取扩大倍的作用,故取=1将方程组写成矩阵形式,即有:
(即:)
此时有:
即得到线性判别函数:
2、判别
计算:——A类代表
——B类代表
——判别指标
判别:
若,则时,属于A类。,则属于B类。
3、检验
(1)对判别函数的检验。
计算一个马哈拉诺比斯(Mahalanobis)距离。
统计量为:
对给定的,若:
,则认为判别函数是显著的,反之不显著。
(注:显著则说明P个指标能够分辨A、B两个总体)
(2)对各个判别指标的检验。
因为是有由P项构成的,因此第K项在中所占的比重,就代表了第K个指标对总距离的贡献,即大,则说明贡献大,反之,贡献小。
先算出
再求出各指标的贡献:
4、应用实例(见P139—例1)
习题:P(五)二十一 1
第12课
三、多组判别分析
1、什么是多组判别分析
问题的提出:
实际工作中需要对多种类型的样品进行判别,如:油层、气层、水层、干层等,这就需要多组判别分析来解决了。
设有m个总体,第g个总体的样品个数为(g=1,2,…,m),每个样品测定了P个指标,此时,可写成:
——第g类,第j个样品第k个指标的观测值。
原始数据可写成:
总共取了N个样品,
现有一新样品,,试判别它属于已知m类的哪一类。
分析:
仿两组判别,求出判别函数,两组求一个判别函数,三组就要求三个判别函数(即:1~2;2~3;1~3);四组就要求6个,一般地说,若有m组,就要求,这样计算量太大,对一个新样品也得计算多个判别值,比较起来,十分困难。因此,求判别函数的方法对多组判别不适用。
在多组判别分析中,我们是这样考虑的。在判别中,我们可能犯这样的错误,即把本应属于g组的样品错分到n组,或者把n组的样品错分到了g 组,这种错误是在所难免的,我们只希望由此造成的平均损失尽可能的小。平均损失最小的准则称为Bayes准则。
平均损失最小用左图解释:
解释:小圆对第1类来说,错分的损失等于0,而对2,3类就不等与0,要找出一种划分法,使得平均错分的损失为最小。
2、Bayes准则
贝叶斯准则就是计算样品y属于各组的概率 (g=1,2,…,m),然后比较这m个概率的大小,将样品y归于最大的那一组。
根据贝叶斯公式,样品y属于第g组的后验概率(条件概率)为:
式中:
—第g组的先验概率,其估计值为:
—样品y在第g组的概率密度。
要计算关键是要知道y在各总体的概率密度。
3、正态总体的判别
设m个总体均服从P维正态分布,即:
—第g个总体的期望;
—第g个总体的协方差。
于是第g个总体的概率密度为:
式中:
—的逆矩阵。
设
文档评论(0)