多重共线性课件.pptVIP

多重共线性课件.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

*多重共線性*第一節多重共線形及其影響一、多重共線形及其分類二、嚴格多重共線形及其危害三、近似多重共線形的原因及其影響*一、多重共線性及其分類多元線性回歸模型要求解釋變數之間不存在線性關係,包括嚴格的線性關係和高度的近似線性關係。但事實上由於模型設定和數據等各方面的問題,模型的解釋變數之間很可能存在某種程度的線性關係。這時候稱多元線性回歸模型存在多重共線性問題。*多重共線性可以分為兩類。如果多元線性回歸模型中,存在兩個或多個解釋變數之間存在嚴格的線性關係,則稱為“完全多重共線性”,也稱為“嚴格的多重共線性”。而解釋變數之間存在近似的而不是嚴格的線性關係,這種情況被稱為“近似多重共線性”。*二、嚴格多重共線形及其危害完全多重共線性不可能由於數據問題引起,通常是由於模型設定問題,把有嚴格聯繫的變數引進同一個模型,或者虛擬變數設置不當引起的。設兩個解釋變數的線性回歸模型為:回歸方程為:*求參數最小二乘估計量的正規方程組為:其中、和分別是、和的離差。設和兩個變數之間有嚴格的線性關係,這個模型當然就存在完全的多重共線性。*此時也成立。把該關係式代入上述正規方程組中的第二式可得:得到:很顯然,這個方程與上述正規方程組的第一個方程是完全相同的。*這意味著我們得到了包含兩個未知參數估計量的兩個相同的方程,這時該方程組有無窮組解而不是有唯一一組解。這實際上意味著被解釋變數究竟受哪些變數的影響變得很不清楚,變數關係是無法識別的。有完全多重共線性的多元線性回歸模型都無法順利進行參數估計,會使多元線性回歸模型參數估計失敗,回歸分析無法進行。*完全多重共線性雖然破壞性很大,卻不是最需要擔心的問題。因為完全多重共線性是由於模型設定問題,把有嚴格聯繫的變數引進同一個模型,或者虛擬變數設置不當引起的,因此只要在建模時適當注意就可以避免。即使由於模型設定的疏忽使得模型存在完全多重共線性問題,也比較容易發現。因為參數估計失效馬上會提示我們這方面的問題。*完全多重共線性問題的處理也比較簡單,只需要針對性地修改模型,放棄、調整相互之間形成線性關係,導致完全多重共線性的部分解釋變數。注意一般不需要也不應該放棄存在線性關係的全部變數,否則容易使模型失去意義。*三、近似多重共線形的原因及其影響近似多重共線性既與變數選擇有關,也與數據有關。雖然解釋變數的選擇不當,把內在相關性較強的變數引進同一個模型,是導致近似多重共線性的重要原因,但近似多重共線性更經常的原因是經濟數據的共同趨勢。*近似多重共線性不會導致參數估計失效,最小二乘參數估計能夠得到唯一解。在模型存在近似多重共線性的情況下,參數的最小二乘估計不僅仍然是唯一存在的,而且仍然是最小方差線性無偏估計。但問題是當存在比較嚴重的近似多重共線性問題時,參數估計方差的絕對水準可能並不小,而且會隨著多重共線性程度的提高急劇上升。*如果用記變數的離差平方和,記變數對其餘個解釋變數的回歸平方和,表示原模型第k個解釋變數對其餘個解釋變數回歸的決定係數,那麼的方差可以寫成:*如果第k個解釋變數與其餘個解釋變數完全沒有相關性,那麼,。當第k個解釋變數與其他解釋變數之間有相關性時,。當第k個解釋變數與其他解釋變數之間有很強的相關性,也就是模型存在很強的近似多重共線性時,接近1,此時的方差會變得非常大。*參數估計量方差的增大,必然導致參數估計的不穩定性提高,容易出現參數符號和數值大小的異常情況,從而使最小二乘估計的有效性受到很大影響。多重共線性正是通過這樣的機制,對多元線性回歸模型的最小二乘估計產生不利影響,其後果常表現為參數估計不穩定,數據的很小變化會引起參數估計值的較大變化,而且參數估計的異常值增多,包括顯著性水準不符合實際,或反映解釋變數作用方向的符號相反等。*近似多重共線性表現形式和原因的多樣性,數據問題導致多重共線性的隱蔽性,使得近似多重共線性的發現、判斷和處理也比較困難。正是因為這些原因,近似多重共線性是我們重點關心的問題,在多數情況下多重共線性指的就是近似多重共線性。*第二節多重共線性的發現和檢驗多重共線性的根源是解釋變數之間的相關性,因此分析解釋變數之間的相關性,進行單相關或多元相關性的分析檢驗

文档评论(0)

子不语 + 关注
官方认证
服务提供商

平安喜乐网络服务,专业制作各类课件,总结,范文等文档,在能力范围内尽量做到有求必应,感谢

认证主体菏泽喜乐网络科技有限公司
IP属地未知
统一社会信用代码/组织机构代码
91371726MA7HJ4DL48

1亿VIP精品文档

相关文档