- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多重共线性处理
目 录
一、摘要 1
二 、引言 1
三、认识多重共线性 1
(一)多重共线性的定义 1
(二)多重共线性产生的危害 2
(三)多重共线性产生的原因 2
(四)多重共线性产生的诊断的方法 3
(五)多重共线性的处理的方法 3
四、 实际的应用 7
(一)普通最小二乘法 7
(二)岭回归 8
(三)主成分回归 10
(四)简单的比较 11
(五)结论和建议 11
五、结论 12
六、参考书目 13
七、附录 14
浅谈多重共线性
摘 要 各解释变量之间存在多重共线性是现实中很普遍的现象。本文对线性估计多重共线性问题进行了简单的介绍,对一些常用的解决多重共线性的方法进行了概括,并运用主成分和岭回归的方法对实际的问题进行了分析.
关键字 岭回归 主成分 多重共线性
Abstact The interpretation of variables between multicollinearity is in reality very common phenomenon. In this paper, linear estimated multicollinearity issue a simple, commonly used to solve a number of multi-linear way of a summary and use of the main components and ridge on the actual return to the way the issue was analyzed.
Keywords Ridge Regression The main component regression collinearity
一.引言
回归分析是一种比较成熟的预测模型,也是在预测过程中使用较多的模型,在自然科学管理科学和社会经济中有着非常广泛的应用,但是经典的最小二乘估计,必需满足一些假设条件,多重共线性就是其中的一种。实际上,解释变量间完全不相关的情形是非常少见的,大多数变量都在某种程度上存在着一定的共线性,而存在着共线性会给模型带来许多不确定性的结果。
二.认识多重共线性
(一).多重共线性的定义
设回归模型ε如果矩阵X的列向量存在一组不全为零的数, I =1,2,…n ,则称其存在完全共线性,如果, I =1,2,…n ,则称其存在近似的多重共线性
(二).多重共线性的危害
1.如果矩阵存在完全共线性矩阵的秩rank(X)p+1,此时||=0正规方程组的解()=Xy的解不为一且 不存在,回归参数的最小二乘估计表达式不成立,最小二乘的系数将得不到估计
2.经济问题中出现最多的是近似共线性的情况,此时矩阵的秩rank(x)=p+1虽然成立,但是||≈0,对角线上的元素很大,估计参数的方差阵的对角线元素很大,而对角线上的元素正式各个参数的方差,这样各个参数的估计的精度就会很低。这时虽然能够得到参数的最小二乘无偏估计,但是回归系数的估计值对样本数据的微小变化将变的非常敏感,回归系数的估计值的稳定性将变得很差。
3当存在严重的多重共线性时,会给回归系数的统计检验造成一定的困难,可能造成F检验获得通过,T检验却不能够通过。
4.在自变量高度相关的情况下,估计系数的含义有可能与常识相反.
5.在进行预测时,因为回归模型的建立是基于样本数据的,多重共线性也是指抽样的数据。如果把建立的回归模型用于预测,而多重共线性问题在预测区间仍然存在,则共线性问题对预测结果不会产生特别严重的影响,但是如果样本数据中的多重共线性发生 了变化则预测的结果就不能完全的确定了
(三).多重共线性产生的原因
1.模型参数的选用不当,在我们建立模型时如果变量之间存在着高度的 相关性,我们又没有进行处理建立的模型就有可能存在着共线性。
2.由于研究的经济变量随时间往往有共同的变化趋势,他们之间存在着共线性。例如当经济繁荣时,反映经济情况的指标有可能按着某种比例关系增长
3滞后变量。滞后变量的引入也会产生多重共线行,例如本期的消费水平除了受本期的收入影响之外,还有可能受前期的收入影响,建立模型时,本期的收入水平就有可能和前期的收入水平存在着共线性。
(四).多重共线性的诊断
1.直观的判断方法
(1)在自变量 的相关系数矩阵中,有某些自变量的相关系数值比较大。
(2)回归系数的符号与专业知识或一般经验相反
(3)对重要的自变量的回归系数进行t检验,其结果不显著,但是F检验确得到了显著 的通过
(4)如果增加一个变量或删除一个变量,回归系数的估计值发生了很大的变化
(5)重要变量的回归系数置信区间明显过大
2.方差扩大因子法(VIF),定义=
您可能关注的文档
- 劳务队伍管理措施.doc
- 加强抗菌药物管理降低药占比及抗菌药物合理应用.doc
- 化妆品用烷基磷酸酯的研究进展分析报告.doc
- 化妆品原料和生产环境中污染菌的检验.doc
- 化妆品的知识与状况.doc
- 化学化工学院生物与制药工程系.doc
- 化学工艺学课程设计.doc
- 化学必修一人教版和鲁科版之对比分析.docx
- 化学发光SOP.doc
- 化学法二氧化氯发生器无锡飞乐.doc
- 2025届中工国际工程股份有限公司校园招聘笔试参考题库附带答案详解.doc
- 2025届乌鲁木齐石化分公司高校毕业生春季招聘10人笔试参考题库附带答案详解.doc
- 2025届华夏金融租赁有限公司校园招聘笔试参考题库附带答案详解.doc
- 2025届物产中大金属集团有限公司校园招聘笔试参考题库附带答案详解.doc
- 2025山东济南城市发展集团春季校园招聘43人笔试参考题库附带答案详解.doc
- 2025山西临县裕民焦煤有限公司招聘15人笔试参考题库附带答案详解.doc
- 2025年01月河南洛阳龙潭大峡谷景区公开招聘20人笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2025中国移动秋季校园招聘启动笔试参考题库附带答案详解.doc
- 2025年02月内蒙古自治区政府系统第二批事业单位公开招聘(赤峰市市直公开招聘23人)笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024年12月湖州长兴事业单位编外公开招聘(2)人长兴县文化和广电旅游体育局笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
文档评论(0)