- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
应用回归分析-第5章课后习题参考答案
第5章 自变量选择与逐步回归
思考与练习参考答案
5.1 自变量选择对回归参数的估计有何影响?
答: 回归自变量的选择是建立回归模型得一个极为重要的问题。如果模型中丢掉了重要的自变量, 出现模型的设定偏误,这样模型容易出现异方差或自相关性 ,影响回归的效果;如果模型中增加了不必要的自变量, 或者数据质量很差的自变量, 不仅使得建模计算量增大, 自变量之间信息有重叠,而且得到的模型稳定性较差,影响回归模型的应用。
5.2自变量选择对回归预测有何影响?
答:当全模型(m元)正确采用选模型(p元)时,我们舍弃了m-p个自变量,回归系数的最小二乘估计是全模型相应参数的有偏估计,使得用选模型的预测是有偏的,但由于选模型的参数估计、预测残差和预测均方误差具有较小的方差,所以全模型正确而误用选模型有利有弊。 当选模型(p元)正确采用全模型(m元)时,全模型回归系数的最小二乘估计是相应参数的有偏估计,使得用模型的预测是有偏的,并且全模型的参数估计、预测残差和预测均方误差的方差都比选模型的大,所以回归自变量的选择应少而精。
5.3 如果所建模型主要用于预测,应该用哪个准则来衡量回归方程的优劣?
答:如果所建模型主要用于预测,则应使用统计量达到最小的准则来衡量回归方程的优劣。
5.4 试述前进法的思想方法。
答:前进法的基本思想方法是:首先因变量Y对全部的自变量x1,x2,...,xm建立m个一元线性回归方程, 并计算F检验值,选择偏回归平方和显著的变量(F值最大且大于临界值)进入回归方程。每一步只引入一个变量,同时建立m-1个二元线性回归方程,计算它们的F检验值,选择偏回归平方和显著的两变量变量(F值最大且大于临界值)进入回归方程。在确定引入的两个自变量以后,再引入一个变量,建立m-2个三元线性回归方程,计算它们的F检验值,选择偏回归平方和显著的三个变量(F值最大)进入回归方程。不断重复这一过程,直到无法再引入新的自变量时,即所有未被引入的自变量的F检验值均小于F检
5.9 在研究国家财政收入时,我们把财政收入按收入形式分为:各项税收收入、企业收入、债务收入、国家能源交通重点建设收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等。为了建立国家财政收入回归模型,我们以财政收入y(亿元)为因变量,自变量如下:x1为农业增加值(亿元),x2为工业增加值(亿元),x3为建筑业增加值(亿元),x4为人口数(万人),x5为社会消费总额(亿元),x6为受灾面积(万公顷)。据《中国统计年鉴》获得1978—1998年共21个年份的统计数据,见表5.4(P167)。由定性分析知,所有自变量都与y有较强的相关性,分别用后退法和逐步回归法作自变量选元。
解:后退法SPSS输出结果:
逐步回归法
二者结果相同,回归方程为:
y=865.929—0.601x1-0.361x2+0.639x5
但是回归系数的解释不合理。
5.10 表5.5的数据是1968-1983年期间与电话线制造有关的数据,各变量的含义如下:
x1——年份;
x2——国民生产总值(10亿美元);
x3——新房动工数(单位:1000);
x4——失业率(%);
x5——滞后6个月的最惠利率;
x6——用户用线增量(%);
y——年电话销量(百万尺双线)。
(1)建立y对x2~x6的线性回归方程。SPSS输出结果如下:
回归方程为:=5922.827+4.864+2.374-817.901+14.539-846.867
其中x2、 x5的系数未通过检验。
(2)用后退法选择自变量。
后退法剔除P值最大的剔除x5,模型的参数均通过显著性检验。(显著性水平α=0.05),得回归方程为:
=6007.320+5.068+2.308-824.261-862.699
模型表明年电话销量(y)与国民生产总值、新房动工数、失业率、用户用线增量有显著的线性关系。
(3)用逐步回归法选择自变量
逐步回归法引入x3,x5,x4进入回归模型,没有剔除变量,保留x3,x5,x4作为最终模型。回归方程为:
y=1412.807+3.440x3—415.136x4+348.729x5
模型表明年电话销量(y)与新房动工费、失业率、滞后6个月的最惠利率 有显著的线性关系。
(4)根据以上计算结果分析后退法和逐步回归法的差异
答:两个方法得到的最终模型是不同的,后退法首先剔除了x5,而逐步回归法在第二步引入了x5,说明两种方法对自变量选取的方法是不同的,这与自变量之间的相关性有关。相比之下,后退法首先做全模型的回归,每个自变量都有机会展示自己的作用,所得结果更值得信服。从本例看,x5是滞后6个月的最惠利率,对因变量的影响似乎不大。
您可能关注的文档
最近下载
- 绿化养护标准图片手册(2015A).pdf VIP
- 《内科输血指南》课件.ppt VIP
- CECS 138-2002给水排水工程钢筋混凝土水池结构设计规程.pdf VIP
- 人教版八年级上册数学期末考试试卷含答案.pdf VIP
- 电子信息工程专业《毕业设计(论文)》教学大纲.pdf VIP
- 压力管道安装材料标识移植记录(示例)参考.docx
- 淮阴工学院2023-2024学年《高等数学(上)》期末考试试卷(A卷)含参考答案.pdf
- 二、DVP结算业务知识及注意事项.pdf VIP
- 高血压危象护理PPT课件.pptx VIP
- 山东省临沂市2024-2025学年高一上学期1月期末考试物理试题(解析版).docx VIP
原创力文档


文档评论(0)