矿床统计预杨测讲义.ppt

  1. 1、本文档共202页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
矿床统计预杨测讲义

8.2 回归分析原理 8.2.2 多元线性回归方程 多元回归的正规方程组与一元情况形式上完全一样: 只是自变量个数不一样。若有p个自变量(p元线性回归): 以上回归分析是用原始数据直接求方程系数,称偏回归系数。偏回归系数不能反映各自变量与因变量的相关性(重要性)。 Eq 8-4 = Eq 8-3 Eq 8-5 8 回归分析法 8.2.2 多元线性回归方程 可以用相关系数矩阵(简称相关矩阵)求回归方程,这时方程中各变量的系数称标准回归系数。正规方程组为 其中 rjk=rkj 是变量 xj 和 xk 的相关系数(Eq 4-9)。rjk=1当 j=k 。 rjy 是变量 xj 和因变量 y 的相关系数。 标准回归系数的符号和绝对值能反映自变量与因变量之间的相关关系。 Eq 8-6 8 回归分析法 1)计算复相关系数。先计算: 总离差平方和(因变量总变化量) 8.2.3 回归方程的显著性检验 可用两种方法: 称复相关系数(拟合优度),其值越大(接近1),回归方程越显著。 回归平方和(回归估值对实测平均值的偏离程度) 偏差平方和(或称剩余平方和,实测值与回归估值的偏离程度) 易证明 Eq 8-7 Eq 8-8 Eq 8-9 Eq 8-10 Eq 8-11 8 回归分析法 2)回归方程的F-检验 8.2.3 回归方程的显著性检验 式中,p和n分别为自变量数和样品数。 算出F值后,给定信度?,第一自由度为p,第二自由度为n-p-1,查F分布表,得表列值 F表 。若 F F表 ,则可认为回归方程显著。 F-统计量为: Eq 8-12 8 回归分析法 8.3 回归分析应用于找矿远景区预测 (1)准备:划分单元,选择控制区,提取、选择变量,获取数据。 (2)利用控制单元数据建立回归方程。 (3)对回归模型(方程)进行显著性检验。若不显著则需要重新考虑所用的变量,或放弃回归分析。 (4)将所有单元的数据代入回归模型,算出各单元中因变量的回归估值。也可以对因变量进行区间估计(见后述)。 (5)根据回归估值大小,圈定找矿远景区。 8.3.1 实施步骤 8 回归分析法 在上述第(4)步中,可对因变量值做区间估计,方法为: 8.3 回归分析应用于找矿远景区预测 8.3.1 实施步骤 8 回归分析法 则 任一估值 ? 落入区间(? ±2?)的概率为0.95,落入区间( ? ±3?) 的概率为0.99。 令 一般来说因变量是单元中的矿床值(如矿床规模、矿床数等)。为了根据回归估值圈定找远景区,需要确定一个指示有远景的下限(临界值)。为了确定该下限值,可以使用类似于前面(第5章)讲过的确定找矿信息量下限的几种方法。 也可以采用下面的方法。 8.3 回归分析应用于找矿远景区预测 8.3.2 根据回归估值大小圈定远景区的方法 8 回归分析法 1)将所有控制单元的因变量值按从小到大排列。 2)以单元号为横坐标,因变量值为纵坐标,作观测值和回归估值曲线。 3)比较两条曲线,考虑样品的原有类别及判对率,选出合适的临界值。 8.3 回归分析应用于找矿远景区预测 8.3.2 根据回归估值大小圈定远景区的方法 矿床值 无矿 矿(化)点 小型矿 中型矿 实测值 回归估值 大型矿 有/无矿临界值 工业矿临界值 大中型矿临界值 8 回归分析法 (1)数据应为定量数据。 (2)因变量应为正态变量(F-检验的前提)。否则应做合适的数据变换。 (3)因变量与各自变量间应有线性相关关系,而各自变量间越不相关越好。(若有两个或多个自变量强相关,则正规方程组的系数矩阵就可能不满秩,方程就不稳定)。如不符合这些条件,则应先进行变量选择,或可使用“逐步回归分析”方法(见教材中的介绍)。 (4)回归分析有许多变种,可以灵活运用。本课程内只介绍了其中最基本的部分。 8.3 回归分析应用于找矿远景区预测 8.3.3 回归分析应用中需注意的问题 8 回归分析法 9.1 判别分析概述 9 判别分析法 判别分析也是一种传统的多元统计分析方法。 判别分析是在假设研究对象分类情况已知的前提下,判断未知样品属于其中哪一类的统计分析方法。 比如在矿产预测中,通过适当选择控制区,可以认为控制单元已经存在不同的类别,如“无矿单元”、“含矿单元”、“含大型矿床单元”等。应用判别分析就可以根据多变量特征,判断任一未知单元属于这些类别中的哪一类,从而实现预测。 广义地说,判别分析与“模式识别” 是同义词。不同的已知类别可以叫做不同的“模式”;判别分析与“监督分类”或“有导师学习”也几乎同义。但狭义的判别分析主要指费歇(Fisher)准则下的判别方法及与其类似或有关的各种传统多元统计分析方法。 基于费歇准则的两类判别,简称为费歇(Fisher)判别,是假设已知分类为二类情况下,判断任一未知样品的类别。 9.2 基于费歇准则的两类

文档评论(0)

181****7523 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档