第16章應用迴歸分析之課題.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第16章應用迴歸分析之課題

第16章 應用迴歸分析之課題 本章主要討論多變數迴歸分析所可能碰到的一些問題,諸如: Multicollinearity(線性重合 Heteroscedasticity(異質變異Autocorrelation(自我相關 等等問題。 16.2 Multicollinearity(線性重合 線性重合(perfect correlated):即兩個自變數的相關係數為1。 高度相關(highly correlated):即兩個自變數的相關係數大於0.8或0.9之情形。 線性重合之問題何在? 1. 如果為完全線性重合(兩個自變數的相關係數為1),則無法用最小平方法求得迴歸係數。 如:(兩個自變數的例子) 若 x1 = c x2 ,而c為常數 最小平方法的一階條件(解b1,b2者): 以x1 = c x2帶入: 上面兩個方程式完全一樣,故而只能解一個變數,無法解兩個變數。 (解決辦法:去掉x1或x2(自變數少了一個,再來做迴歸估計,就不會有這個問題了。 2. 如果為高度相關者,其迴歸係數的變異數變得相當大(請看第702頁的16.2與16.3式,因r值接近於1,故變異數趨近於極大),因此,所估計的迴歸係數將因不同的抽樣而有相當大的變異(不同樣本間估計值之差異將會很大);此外,因迴歸係數的變異數很大,其t值就會變小,因此使得迴歸係數顯得很不顯著。 3. 無法確實地分離出某自變數(如x1)對應變數的單獨影響效果,因為當x1變動時,與其相關的x2也會一起變動,故而,我們很難分辨y的變動是由何者(即x1或x2)所造成。 然而,在例16.1中可以看到:雖然t檢定不顯著,但線性重合對ANOVA的F檢定並無影響。 判定線性重合的經驗法則: 1. 先看自變數之間的相關係數是否大於0.8或0.9。 2. 如果自變數的個數超過兩個以上,除了相關係數外,還要看各自變數與所有其他自變數之間是否高度相關。 作法:另外做自變數間的迴歸估計(見第703頁的第16.5式),並求各估計式的判定係數,然後以VIF(variance inflationary factor)作為判定之標準:亦即,VIF ≥ 10才有線性重合的問題。 例如:16.4式為三個自變數的例子 y = α+β1x1 +β2x2 +β3x3 +ε 再估計: x1 = a0 + a1 x2 + a2 x3 x2 = b0 + b1 x1 + b2 x3 x3 = c0 + c1 x1 + c2 x2 然後,求Ri2值,i = 1,2,3,VIFi = 1/(1- Ri2) 若VIF>10,則 0.95<|Ri|<1 例16.1:(第704頁)分析線性重合的問題: 30個公司,1983-1985年(三個樣本)的資料來估計:n=30, k=2 y=PPS, x1=DPS,x2=RE 迴歸估計式如下: 1983: y = 22.773 + 10.733 x1 + 1.431 x2 (F=16.11) (4.15) (4.28) (2.30) 1984: y = 11.336 + 12.434 x1 + 3.088 x2 (F=31.44) (2.33) (4.41) (2.39) 1985: y = 21.529 + 12.553 x1 + 3.014 x2 (F=15.97) (2.81) (3.16) (1.81) 顯著水準:5% H0:β1=β2=0 H1:β1≠0, orβ2≠0 F檢定的臨界值=3.35 (F檢定顯示迴歸估計的係數相當顯著。 再看:x1 = a0 + a1 x2 的R2值 記住:在這裡R2=r212 =(0.6064)2 因此,VIF=1/[1-(0.6064)2]=1.5815<10 其VIF遠低於10,故此迴歸模型比較沒有線性重合的問題。 16.3 Heteroscedasticity (異質變異) 前面所提之迴歸分析皆為同質變異,即不同樣本點(觀察值)之變異皆相同:σi =σj =σ, i≠j 而此處的變異則隨樣本之不同而有所差異,例如:大廠的營收之迴歸估計誤差的變異大於小廠者,或高收入家庭支出的變異程度常大於低收入者,在現實生活中常可見到此種現象。 異質變異的問題所在: 最小平方法在估計時,大誤差與大變異的觀察值所給的權數較大,因此,對於誤差與變異較大的部分之觀察值之估計較為理想,反之對於小誤差與小變異的觀察值部分則較不理想,事實上,最小平方法因使用同質變異之假設,故而不能得到使估計誤差的變異數最小之結果。 如何辨識異質變異之問題? 1. 最簡單的方法就是畫圖,觀察誤差項e與自變數(或y的估計/期望值)間的關係。如果資料分散的情形(即離散度)相當一致,則為同質變異,否則,就

文档评论(0)

sunhao111 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档