网站大量收购闲置独家精品文档,联系QQ:2885784924

6第六章地理系要素的逐步回归分析.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 地理系统要素的逐步回归分析 地理系统是一个要素众多、联系复杂的大系统。各个因素之间存在错综复杂的关系。在水文、气象、地震等预报工作中,以及进行人文地理、经济地理要素分析的时候,常需选出对y研究变量 (即因变量或预报量)有影响的因子(即自变量)。虽然可以从理论分析方面,选出一些对y有影响的自变量。但由于变量y构成的复杂性,这些因子对y的关系究竟如何,不是单凭理论分析就可判定的。其中可能有些对y有显著影响,有些则影响很小。为了避免遗漏对y有显著影响的因子,所以在初选因子时往往考虑的面较广,拟定的因子也比较多,有时可达几十个。于是就提出一个问题:如何在这许多因子中,选出对y影响最大的一些因子,从而建立对这批地理数据称之为“最优”的线性回归方程呢?这就是本章所要解决的问题。 §1最优回归方程的选择 所谓最优回归方程,是指以下两个意义。一方面,一般地回归方程中包含的变量越多,回归平方和就越大,剩余平方和就越小;另一方面,一个合理的回归方程应该只包含显著的因子,而不应包含不显著的因子。因为因子数量过多,获取和计算工作量增大,并且如果回归方程中包含有对y根本不起作用或起很小作用的变量,剩余平方和并不会由于这些变量而减少多少,相反的由于(剩余)自由度的减少,剩余方差倒有可能反而增大,同时,这些对y影响不显著的变量也会影响回归方程的稳定性而使预报效果降低。综合以上两个方面,所谓最优的回归方程就是包含所有对y显著的变量而不包含对y不显著变量的回归方程。 选择最优回归方程几种不同的方法。 从所有可能的变量组合的回归方程中挑选最优者  共有个方程 n个变量情况下 对每个方程及自变量作显著性检验,然后从中挑选所有的变量全部显著,且剩余均方和较小方程。 2.从包含全部变量的回归方程中逐次剔除不显著的因子  ——剔去不显著因子中偏回归平方和最小的那个因子 3.从一个自变量开始,把变量逐个引入回归方程   先计算各因子与 y 的相关系数,将绝对值最大的一个因子引入方程,对回归平方和进行显著性检验,余下的因子中与y 的偏相关系数(除去已引入的因子的影响后,二者间的相关系数)最大的那个,经检验结果是显著的,引入到方程,依次类推。 4.结合方法3与方法2 采用这种方法时,首先将对因变量关系最密切的自变量引入,然后在剩下的变量中再选取与因变关系较为密切的变量“引入”下一个变量以前,对已引入的变量先进行检查,看是否可以剔除。若检查结果,不能剔除,则再引入较为重要的新变量。一般在引入第三个变量之前,就要先考虑剔除变量的问题,这是因为引入新变量后原有变量的作用可能减小而需要剔除。例如,当引入第二个较为重要的新变量时,第一个变量就可能不起作用,需要剔除。故在引入第三个变量之前就需要检验并剔除那个已变得不重要的变量,然后再引入新的变量。 因此采用逐步回归方法可以保证最终引入回归式的变量都是对因变量关系密切,即有显著意义的变量。 §2“引入”和“剔除”变量的标准 “引入”和“剔除”变量的标准可以根据变量的方差贡献来确定。 设在逐步回归的第步已有个自变量引入回归方程,则回归方程为: 这时相应的总平方和可分解成回归平方和剩余平方和二部分,即 注意,这里和符号中的脚标,表示已引入的变量数(而不是第个变量)。 若下一步,即第步引入变量,则有回归方程为: 这时=+ ………………………………(2) 因为总平方和不变,所以变量引入后,回归平方和从增加到,而剩余平方和则从减少到。因此由变量引起的平方和的变化为: -=- …………………………………(3) 更确切地说,表示由于引入变量后回归平方和的增加量(或相应为剩余平方和的减少量),通常称之为对的方差贡献。可用以衡量对所起作用的大小。 因此检验是否可以引入时,采用如下统计量: …………………(4) 式中为剩余平方和的自由度,其中为已引入的变变量数。 变量对作用是否显著,可用上述统计量进行检验。在给定的显著性水平下确定临界值,当计算的统计量值时表明引入的自变量有显著意义的,否则当时,引入的变量就没有意义。 同样,若第步为剔除变量时,则有回归方程: 故:+ …………………………………………(5) 因为总平方和不变,所以变量剔除后回归平方和从减少为,而剩余平方和从增加到。这时变量剔除后回归平方和的减少量(或剩余平方和的增加量)为: -=- …………………………………(6) 因此检验变量是否可以剔除时,采用如下统计量: ……………………………………(7) 式中是剩余平方和的自由度。 同样,在给定水平下确定临界值,当统计量时,则说明

您可能关注的文档

文档评论(0)

lanhe8975915 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档