- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
应用回归分析第七答案应用回归分析第七章答案
岭回归
岭回归估计是在什么情况下提出的?
答:当解释变量间出现严重的多重共线性时,用普通最小二乘法估计模型参数,往往参数估计方差太大,使普通最小二乘法的效果变得很不理想,为了解决这一问题,统计学家从模型和数据的角度考虑,采用回归诊断和自变量选择来克服多重共线性的影响,这时,岭回归作为一种新的回归方法被提出来了。
岭回归估计的定义及其统计思想是什么?
答:一种改进最小二乘估计的方法叫做岭估计。当自变量间存在多重共线性,∣XX∣≈0时,我们设想给XX加上一个正常数矩阵kI(k0),那么XX+kI 接近奇异的程度小得多,考虑到变量的量纲问题,先对数据作标准化,为了计算方便,标准化后的设计阵仍然用X表示,定义为 ,称为的岭回归估计,其中k称为岭参数。
选择岭参数k有哪几种主要方法?
答:选择岭参数的几种常用方法有1.岭迹法,2.方差扩大因子法,3.由残差平方和来确定k值。
用岭回归方法选择自变量应遵从哪些基本原则?
答:用岭回归方法来选择变量应遵从的原则有:
(1)在岭回归的计算中,我们假定设计矩阵X已经中心化和标准化了,这样可以直接比较标准化岭回归系数的大小,我们可以剔除掉标准化岭回归系数比较稳定且绝对值很小的自变量。
当k值较小时标准化岭回归系数的绝对值并不是很小,但是不稳定,随着k的增加迅速趋于零。像这样的岭回归系数不稳定,震动趋于零的自变量,我们也可以予以删除。
去掉标准化岭回归系数很不稳定的自变量,如果有若干个岭回归系数不稳定,究竟去掉几个,去掉哪几个,这并无一般原则可循,这需根据去掉某个变量后重新进行岭回归分析的效果来确定。
对第5章习题9的数据,逐步回归的结果只保留了3个自变量x1,x2,x5,用y对这3个自变量做岭回归分析。
答: 依题意,对逐步回归法所保留的三个自变量做岭回归分析。
程序为:
includeC:\Program Files\SPSSEVAL\Ridge regression.sps.
ridgereg dep=y/enter x1 x2 x5
/start=0.0/stop=1/inc=0.01.
岭迹图如下:
计算结果为:
可以看到,变量x1、x2迅速由负变正,x5迅速减小,在0.01-0.1之间各回归系数的岭估计基本稳定,重新做岭回归。岭迹图如下:
先取k=0.08:
语法命令如下:
includeC:\Program Files\SPSSEVAL\Ridge regression.sps.
ridgereg dep=y/enter x1 x2 x5
/k=0.08.
运行结果如下:
得到回归方程为:
再取k=0.01:
语法命令如下:
includeC:\Program Files\SPSSEVAL\Ridge regression.sps.
ridgereg dep=y/enter x1 x2 x5
/k=0.01.
运行结果:
****** Ridge Regression with k = 0.01 ******
Mult R .9931857
RSquare .9864179
Adj RSqu .9840210
SE 329.6916494
ANOVA table
df SS MS
Regress 3.000 134201841 Residual 17.000 1847841.9 108696.58
F value Sig F
411.5487845 .0000000
--------------Variables in the Equation----------------
B SE(B) Beta B/SE(B)
x1 .0556780 .0615651 .0981355 .9043751
x2 .0796395 .0218437 .3291293 3.6458814
x5 .1014400 .0108941 .5621088 9.3114792
Constant 753.3058478 121.7381256 .0000000 6.1879205
回归方程为: y=753.3058-0.05568x1-0.0796x2+0.1014x5
从上表可
您可能关注的文档
- 展示设计中人体工学的用几分析展示设计中人体工学的应用几分析.doc
- 山东人民出版社B山东民出版社B.doc
- 山东全省卫生系统六五法学习题库(全部试题答案)打印版山东全省卫生系统六五普法学习题库(全部试题答案)打印版.doc
- 山东农业大学09-1-1-软件工程A卷2山东农业大学09-10-1-软件工程A卷2.doc
- 就业形势和就业政策(业渠道)就业形势和就业政策(就业渠道).ppt
- 小数的近似数图文版小的近似数图文版.doc
- 山东省2013年高考史二轮阶段检测示范卷 第二单元 古代希腊罗马的政治制度专题训练(含解析)岳麓版必修1山东省2013年高考历.doc
- 山东省普通高中学生学水平考试信息技术纲要山东省普通高中学生学业水平考试信息技术纲要.doc
- 山东寿光蔬菜产业山东光蔬菜产业.ppt
- 山东省泰安市岱岳区范第二中学2014-2015学年八年级历史上学期10月月考试题(无答案) 新人教版山东省泰安市岱岳区范镇.doc
最近下载
- 民用无人机驾驶员训练手册模板.docx
- DIN 5480中文版渐开线花键2006.pdf
- 江西省2024年初中学业水平考试历史试题卷(含答案).pdf VIP
- 国开电大《市场调查与商情预测》形考作业1-4参考答案.pdf
- 2025年3月-7月深入贯彻中央八项规定精神学习教育进度计划表+八项规定精神学习教育学习计划表格.doc VIP
- 高尔夫、活动赛事流程.doc VIP
- 规范性文件制定和备案审查监督75页PPT.ppt
- 光纤通信系统第三版沈建华习题答案.pdf
- 住建部检查建设工程施工质量检查表.pdf
- 2024年医学高级职称-临床医学检验临床免疫(医学高级)考试历年(2018-2023)真题荟萃附答案.docx
文档评论(0)