矿床统计预测2017-8-回归分析法概要.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
矿床统计预测2017-8-回归分析法概要

8.1 概述 8 回归分析法 回归分析是一类重要的多元统计分析方法。它的基本思路是以大量观测数据为基础,用某种最优化方法(通常为最小二乘法),研究和发现两组变量之间的统计相关关系,也就是一组变量对另一组变的依赖关系,并根据这种依赖关系,利用一组变量的值估计或预测另一组变量的值。它所找到的这种统计相关关系用一个或一组方程式表示,称为回归方程,也称回归模型。 8.1 概述 8 回归分析法 统计相关关系在自然界普遍存在。理论上任何物理过程都受物理定律支配,参与这些过程的各种因素有一定的相互依赖关系。但因过程的复杂性、未知因素及观测误差的存在,这些依赖关系较复杂,往往不能用确定的理论公式严格地表示,但可能通过统计分析来发现和表达。例如现实中,可能由于温度随机波动及测量误差的影响,欧姆定律也只能从统计的角度被观测到。矿床值与地质因素之间也会表现出统计相关。 电流 电压 欧姆定律 实际观测数据 8.1 概述 8 回归分析法 所研究的两组变量中,被估计的变量称因变量,而据以对因变量进行估计的变量称自变量。因变量和自变量都可以有1个或多个。如果自变量只有一个,称为一元回归分析;如自变量有多个,称多元回归分析。 回归方程最常用的是线性方程,即方程中只含有各个自变量的一次幂和常数。这种回归分析称为线性回归。若回归方程中含有自变量的高次幂或其它非线性项,则统称为非线性回归。 在矿床统计预测中,常用的是只含有1个因变量的多元线性回归分析。因变量是矿床值,自变量是各种地质因素或找矿标志。如果找到了矿床值与地质因素之间的统计相关关系,即可根据地质因素对矿床值进行预测。 8.1 概述 回归分析方法并不保证其估计或预测结果是准确的,但可以保证预测结果是“最优”的,即“最可能、最合理、最符合观测结果”。 回归分析提供预测结果的同时,还可以提供该结果的可靠程度(置信度),以及可能的精度(置信区间)。 8 回归分析法 8.2 回归分析原理 8.2.1 一元线性回归方程 设因变量y和自变量x的观测数据如图。回归分析的任务是找到一条最优的直线以代表所有观测点分布的趋势。这就是要找到直线方程系数b和常数a,使直线与所有观测点距离总和达到最小。 将自变量值代入回归方程得到的因变量估值称为回归估值。 xi y ? = a + bx x yi ?i ?i - yi 回归方程 因变量 自变量 许多观测数据点 为求出最优直线方程,要应用最小二乘法原理。 8 回归分析法 回归估值 达到极小值,从而求出a, b 。上式中n 为观测数据点总数。 最小二乘法令回归估值 与因变量观测数据 的偏差平方和 8.2 回归分析原理 8.2.1 一元线性回归方程 Eq 8-1 8 回归分析法 xi y ? = a + bx x yi ?i ?i - yi 回归方程 因变量 自变量 观测数据 回归估值 8.2 回归分析原理 8.2.1 一元线性回归方程 为求Q的极小值,令 即 整理得 该方程组称正规方程组,从中可以解出a和b。 8 回归分析法 8.2 回归分析原理 8.2.1 一元线性回归方程 正规方程组可写成矩阵形式: 或 或 若 满秩,则有: Eq 8-2 Eq 8-3 8 回归分析法 根据Eq8-3,用观测数据可以直接计算出回归系数,得到回归模型。 8.2 回归分析原理 8.2.2 多元线性回归方程 多元线性回归的正规方程组与一元情况在形式上完全一样: 只是自变量个数不一样。若有p个自变量(p元线性回归): 以上用原始数据直接求出的方程系数,称偏回归系数,回归方程也称偏回归方程。偏回归方程能反映因变量与自变量之间的统计相关,偏回归系数不能具体反映各自变量与因变量的相关性。 Eq 8-4 = Eq 8-3 Eq 8-5 8 回归分析法 8.2.2 多元线性回归方程 可以用相关系数矩阵(简称相关矩阵)求回归方程,这时方程中各变量的系数称标准回归系数。正规方程组为 其中 rjk=rkj 是变量 xj 和 xk 的相关系数(Eq 4-9)。rjk=1当 j=k 。 rjy 是变量 xj 和因变量 y 的相关系数。 如在做回归分析前将所有数据标准化,则用规格化后数据算乘积矩阵 Eq 8-6 8 回归分析法 标准回归系数能具体反映各个自变量与因变量之间的相关关系。 正好是各自变量的相关矩阵,而 是各自变量与y的相关系数向量。 标准化的计算公式为 正规方程组为 回归模型建立之后,应当对它进行检验,以判断其可靠性或有效性。 以下原因可能造成线性回归模型不显著(即无效): 1)因变量与自变量之间线性相关性不强或不相关。有时因变量与自变量之间虽然非线性相关,也可能会使线性回归模型不显著。 2)观测数据过少,缺乏统计意义。 3)多个自变量间强相关,从而乘积矩阵 不满秩。这会使正规方程组的解不稳定,

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档