- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
式中: —第j个自变量的标准回归系数。 Cjj—相关矩阵中对角线上的第j个元素 SSD —剩余平方和 若Fj≥ ,则认为bj在α信度水平上(0.01, 0.05, 0.1)显著。即xj对y的影响重要,反之,可将xj从方程中剔除。 这里又出现一个问题,因为各自变量之间可能存在一定的相关性,所以从回归方程中剔除一个变量后,其他变量的回归系数将会有所变化。因此,每剔除一个变量后,就应该重新计算新的回归系数 ,建立新的回归方程。 当变量xi被剔除后, 与bj有以下关系: (i ≠j) bi—被剔除变量xi在原方程中的回归系数 bj—未剔除变量xj在原方程中的回归系数 —剔除xi后,xj的新回归系数 Cij和 Cii—原p元回归相关矩阵C=[Cij]中的相应元素。 (五)在成矿远景区预测中的应用 1. 将各控制单元的自变量代入最优回归方程,求出各控制单元的回归估计值。 这样,每个单元都有一个观测值yi和回归估值 。 以控制单元为横坐标,以矿床值(或其对数值)为纵坐标,绘出矿床值上升序列曲线图。根据上升序列曲线图及各单元的矿化情况,确定回归估计临界值。确定回归估计临界值时要考虑以下因素。 (1) 已知单元矿床值的大小及预测要求。 (2) 上升序列曲线的变化趋势。 回归估计临界值也可采用: 已知有矿控制单元回归估计值的平均值或最小值,已知有矿床单元回归估值的最小值与已知有矿点单 元回归估值最大值的平均值。 将未知单元的自变量观测值代入回归方程,确定每个 单元的回归估计值 若某单元的回归估计值大于回归临界值,说明该单元为找矿远景单元,其中可能有矿床的产出。反之,可能为无矿单元。 另外,还可将未知单元回归估计值的大小与已知有矿单元回归估计值进行对比,以此来确定找矿远景单元的级别。 如果控制单元的矿床值yi与回归估计值 呈 线性相关,则可将预测单元的回归估值转换成矿床值,并进而转换成资源量。 注意在所选控制区单元中自变量的取值尽可能分散一些,样本可尽可能大一些(使得回归系数估计更稳定和避免回归曲线外推预测) 注意异常值和空缺数据的处理。 注意其时间、空间特性(时间序列数据、空间数据),要注意数据是否具备可比性、等方差性。 在回归模型的运用中,我们还强调定性分析与定量分析的有机结合。数理统计方法所研究的数量关系是否反映事物的本质?本质究竟如何?在实际问题中,我们不能仅凭样本数据估计的结果不加分析地定论,必须把参数估计的结果和学科理论知识、具体地质问题以及现实情况紧密结合,这样才能保证回归模型在地质问题研究中的正确应用。 当然,建立正确的数学模型,有效提取信息、有效解释变异和有效查明数量规律,对于地质概念和定义的多解性、地质假说及理论的可检验性可发挥特殊作用。 第四节 逐步回归 在实际问题中可以提出许多对应变量有影响的自变量,变量选择太少或不恰当,会使建立的模型与实际有较大的偏离; 而变量选得太多,增加了模型的复杂度,模型应用费用增加,并且有时也会削弱估计和预测的稳定性。 我们希望矿床值和各地质因素及找矿标志线性关系密切,即回归效果要好,同时方程中每个自变量对矿床值的影响显著而相互之间的相关很小(避免提供重叠信息)。这就存在回归方程中最优变量组合问题。 这样,既保证尽量高的预报精度,同时最大限度地减少自变量是运算方便又不失信息。 一、回归分析中变量选择问题 变量选择问题是一个十分重要的问题! ①对因变量有显著作用的自变量, 全部选入回归方程; ②对因变量无显著作用的自变量, 一个也不引入回归方程。 “最优回归方程” 是指: 选择”最优回归方程”的方法有: 1.最优子集回归法 2.向后剔除法(backward selection) 3.向前引入法(forward selection) 4.逐步回归法(stepwise selection) 逐步选择法 按一定准则选择最优模型,常用的准则有: ①校正决定系数(考虑了自变量的个数):R2adj达到最大。 ②Cp准则(C即criterion,p为所选模型中变量的个数:Cp统计量达到最小 ③AIC准则 (Akaike’s Information Criterion) :AIC 越小越好 有p个可供选择的自变量,可能的回归方程有2p-1个。 二、最优子集回归法 三、逐步选择法 1. 前进法(forward selection) ---只进不出 若max(Fj)Fα,引入j变量 后退法(backward
文档评论(0)