- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1; 在气象预报中,对预报量的预报常常需要从可能影响预报y的许多因素中挑选一批关系较好的作为预报因子,应用多元线性回归的方法建立回归方程来作预报。;;逐步回归
分析方法是针对这一问题提出的一种常用的方法。;因子数目 – Number of factors;
Model;因子数目 –Number of factors;;因子数目 –Number of factors;单相关系数越高,对残差平方和下降的贡献越大,即r越大,Q越小;
多引入一个因子,残差平方和就下降一些。
例如在r=0.5时,从用1个因子建立回归方程到用2个因子建立回归方程,残差平方和从0.75下降到0.67,下降幅度是0.08(表2.4)。
表明,增加因子个数会使方程残差平方和缩小,有利于资料的拟合。;当因子增加到一定数目,残差平方和下降的幅度就很小了。
例如在r=0.5时,从用7个因子建立回归方程到用8个因子建立回归方程,残差平方和从0.56下降到0.55,下降幅度只下降了0.01。以后下降速度更慢。
说明,再增加因子个数对提高方程的精度已经不起多大作用。;;因子数目 –Number of factors;因子数目太多,对回归方程残差平方和Q 下降的贡献已经不大,反而增加了计算工作量;
因子之间相关较小(近似独立)时,对回归方程残差平方和Q 下降的贡献较大;
因此,在选择因子时,要使得因子之间的相关系数尽可能的小,而因子与预报量之间的相关要尽可能大,才能提高方程的精度.;逐步回归;回归系数的显著性检验;在假设条件成立下,用统计量;例;即
;于是标准化变量回归方程可写为;首先我们对bz1 进行检验,在假设 ?z1 =0 的条件下,有;同样,对bz4 行类似检验,算出 F=1.89 Fα 。
说明bz4也是不显著的。 ; 就一般情况而言,回归方程中所包含的因子个数越多,那么回归平方和 U 就越大,残差平方和 Q 就越小,残差方差的估计 就愈小,预报值的置信区间就愈小,方程一般也较容易通过检验。;但是,因子个数增多,也给方程增加了不少与预报量关系不大的因子,给预报带来下面三个明显的缺点:
首先,在预报时,由于因子增多,计算量大,要花很多计算时间;
第二,如果方程中含有对 y 不起作用或作用极小的因子,那么残差平方和不会由于这些变量??增加而减少多少,相反由于 Q 的自由度的减少,使残差方差估计 增大,影响预报值置信区间估计的增大;;第三,由于存在着对预报量 y 影响不显著的因子,随之带来许多其它与预报量无关的随机因素,以致影响回归方程的稳定性,反而使预报效果下降。 ; 我们还是通过对[例4]中所选的四个因子来讨论这个问题。
我们先来考察由4个因子组成的回归方程一共有多少种组合,对每一种组合的回归方程,计算其残差方差估计,并对方程中每个因子进行显著性检验。24-1=15种。;;而全部因子显著、且 较小的是第(5)个方程,即; 一个可行的方案是:从包含全部变量的回归方程中逐步剔除不显著的因子。
例如:上例中的情况,一开始建立方程(15),然后对每个因子作检查。
因为在作单个因子检验时,公式(2.37)中分母是不变的(在不同因子检验时),因此只比较各因子的分子部即可,从它们之中找出方差贡献最小者作 F 检验。 ; 若方差贡献最小者的F检验结果是显著的,则其余因子自然也是显著的,就不需要再一个个分别作检验;
若方差贡献最小者的F检验结果不显著,则剔除这一因子,然后对少一个因子的方程再重复上一过程。
重复上面的过程,直到产生 “最优”的方程。这是一个可行的方案。; 在这一方案中,还存在三个问题:
其一是因子的方差贡献代表什么样的意义;
其二是为什么不同时把几个不显著的因子从方程中剔除出去,而是要每次剔除一个;
其三是在过程中,每剔除一个因子就得重新计算新方程中的回归系数,当因子较多时,计算量仍是很大。;回答问题一:
我们知道,总离差平方和可以分解为回归平方和和残差平方和,其中回归平方和是所有因子对预报量的总贡献。
所考虑的因子越多,回归平方和就越大,因此若从所考虑的因子中去掉一个因子时,回归平方和只会减少,不会增加。减少的数值越大,说明该因子在回归中所起的作用越大,表明该因子越重要,可用此衡量该因子的方差贡献大小。
Vk就是去掉因子xk后,回归平方和减少的量。
这部分又称偏回归平方和,它可以衡量每个因子在回归中所引起的作用的大小。;回答问题二:
在剔除因子的过程中,两个因子方差贡献都比较小,我们只能剔除其中一个,而不应该一起剔除。
因为两个因子之间可能存在密切的相关关系,在剔除其中一个之后,这时回归平方和不会减小很多。但是如果两个因子同时剔除,则会比较多地减少
您可能关注的文档
最近下载
- 小学生心理健康教育主题班会教案.docx VIP
- 糖尿病入院记录模板.docx VIP
- soap病历中医的书写课件.ppt VIP
- V90伺服驱动器与S7-1200通过FB284进行PROFINET通信的具体方法和步骤(非常详细).docx VIP
- 体育教学论:体育教学过程PPT教学课件.pptx VIP
- DB61_T 1741-2023 矿山生态监测规范.doc VIP
- 2025年广东省湛江市中考物理试题(含答案解析).pdf VIP
- 数字技术赋能基层社会治理研究.docx VIP
- 高考语文一轮复习-- 辨析修改语序不当、搭配不当病句——抓住病症,找出病因.doc VIP
- 北京市中国人民大学附属中学2025届高三年级10月质量检测练习化学试卷+答案.pdf VIP
文档评论(0)