气象统计分析与预报方法:07_第二章-回归分析3.pptxVIP

气象统计分析与预报方法:07_第二章-回归分析3.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1; 在气象预报中,对预报量的预报常常需要从可能影响预报y的许多因素中挑选一批关系较好的作为预报因子,应用多元线性回归的方法建立回归方程来作预报。;;逐步回归 分析方法是针对这一问题提出的一种常用的方法。;因子数目 – Number of factors; Model;因子数目 –Number of factors;;因子数目 –Number of factors;单相关系数越高,对残差平方和下降的贡献越大,即r越大,Q越小; 多引入一个因子,残差平方和就下降一些。 例如在r=0.5时,从用1个因子建立回归方程到用2个因子建立回归方程,残差平方和从0.75下降到0.67,下降幅度是0.08(表2.4)。 表明,增加因子个数会使方程残差平方和缩小,有利于资料的拟合。;当因子增加到一定数目,残差平方和下降的幅度就很小了。 例如在r=0.5时,从用7个因子建立回归方程到用8个因子建立回归方程,残差平方和从0.56下降到0.55,下降幅度只下降了0.01。以后下降速度更慢。 说明,再增加因子个数对提高方程的精度已经不起多大作用。;;因子数目 –Number of factors;因子数目太多,对回归方程残差平方和Q 下降的贡献已经不大,反而增加了计算工作量; 因子之间相关较小(近似独立)时,对回归方程残差平方和Q 下降的贡献较大; 因此,在选择因子时,要使得因子之间的相关系数尽可能的小,而因子与预报量之间的相关要尽可能大,才能提高方程的精度.;逐步回归;回归系数的显著性检验;在假设条件成立下,用统计量;例;即 ;于是标准化变量回归方程可写为;首先我们对bz1 进行检验,在假设 ?z1 =0 的条件下,有;同样,对bz4 行类似检验,算出 F=1.89 Fα 。 说明bz4也是不显著的。 ; 就一般情况而言,回归方程中所包含的因子个数越多,那么回归平方和 U 就越大,残差平方和 Q 就越小,残差方差的估计 就愈小,预报值的置信区间就愈小,方程一般也较容易通过检验。;但是,因子个数增多,也给方程增加了不少与预报量关系不大的因子,给预报带来下面三个明显的缺点: 首先,在预报时,由于因子增多,计算量大,要花很多计算时间; 第二,如果方程中含有对 y 不起作用或作用极小的因子,那么残差平方和不会由于这些变量??增加而减少多少,相反由于 Q 的自由度的减少,使残差方差估计 增大,影响预报值置信区间估计的增大;;第三,由于存在着对预报量 y 影响不显著的因子,随之带来许多其它与预报量无关的随机因素,以致影响回归方程的稳定性,反而使预报效果下降。 ; 我们还是通过对[例4]中所选的四个因子来讨论这个问题。 我们先来考察由4个因子组成的回归方程一共有多少种组合,对每一种组合的回归方程,计算其残差方差估计,并对方程中每个因子进行显著性检验。24-1=15种。;;而全部因子显著、且 较小的是第(5)个方程,即; 一个可行的方案是:从包含全部变量的回归方程中逐步剔除不显著的因子。 例如:上例中的情况,一开始建立方程(15),然后对每个因子作检查。 因为在作单个因子检验时,公式(2.37)中分母是不变的(在不同因子检验时),因此只比较各因子的分子部即可,从它们之中找出方差贡献最小者作 F 检验。 ; 若方差贡献最小者的F检验结果是显著的,则其余因子自然也是显著的,就不需要再一个个分别作检验; 若方差贡献最小者的F检验结果不显著,则剔除这一因子,然后对少一个因子的方程再重复上一过程。 重复上面的过程,直到产生 “最优”的方程。这是一个可行的方案。; 在这一方案中,还存在三个问题: 其一是因子的方差贡献代表什么样的意义; 其二是为什么不同时把几个不显著的因子从方程中剔除出去,而是要每次剔除一个; 其三是在过程中,每剔除一个因子就得重新计算新方程中的回归系数,当因子较多时,计算量仍是很大。;回答问题一: 我们知道,总离差平方和可以分解为回归平方和和残差平方和,其中回归平方和是所有因子对预报量的总贡献。 所考虑的因子越多,回归平方和就越大,因此若从所考虑的因子中去掉一个因子时,回归平方和只会减少,不会增加。减少的数值越大,说明该因子在回归中所起的作用越大,表明该因子越重要,可用此衡量该因子的方差贡献大小。 Vk就是去掉因子xk后,回归平方和减少的量。 这部分又称偏回归平方和,它可以衡量每个因子在回归中所引起的作用的大小。;回答问题二: 在剔除因子的过程中,两个因子方差贡献都比较小,我们只能剔除其中一个,而不应该一起剔除。 因为两个因子之间可能存在密切的相关关系,在剔除其中一个之后,这时回归平方和不会减小很多。但是如果两个因子同时剔除,则会比较多地减少

文档评论(0)

学习让人进步 + 关注
实名认证
文档贡献者

活到老,学到老!知识无价!

1亿VIP精品文档

相关文档