第16章應用迴歸分析之課題.docVIP

下载本文档

1
0
约4.6千字
约 16页
2016-12-05 发布于天津
举报
版权申诉

第16章應用迴歸分析之課題.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第16章應用迴歸分析之課題

第16章應用迴歸分析之課題本章主要討論多變數迴歸分析所可能碰到的一些問題，諸如： Multicollinearity（線性重合 Heteroscedasticity（異質變異Autocorrelation（自我相關等等問題。 16.2 Multicollinearity（線性重合線性重合(perfect correlated)：即兩個自變數的相關係數為1。高度相關(highly correlated)：即兩個自變數的相關係數大於0.8或0.9之情形。線性重合之問題何在？ 1. 如果為完全線性重合（兩個自變數的相關係數為1），則無法用最小平方法求得迴歸係數。如：（兩個自變數的例子）若 x1 = c x2 ，而c為常數最小平方法的一階條件（解b1,b2者）：以x1 = c x2帶入：上面兩個方程式完全一樣，故而只能解一個變數，無法解兩個變數。 (解決辦法：去掉x1或x2(自變數少了一個，再來做迴歸估計，就不會有這個問題了。 2. 如果為高度相關者，其迴歸係數的變異數變得相當大（請看第702頁的16.2與16.3式，因r值接近於1，故變異數趨近於極大），因此，所估計的迴歸係數將因不同的抽樣而有相當大的變異（不同樣本間估計值之差異將會很大）；此外，因迴歸係數的變異數很大，其t值就會變小，因此使得迴歸係數顯得很不顯著。 3. 無法確實地分離出某自變數（如x1）對應變數的單獨影響效果，因為當x1變動時，與其相關的x2也會一起變動，故而，我們很難分辨y的變動是由何者（即x1或x2）所造成。然而，在例16.1中可以看到：雖然t檢定不顯著，但線性重合對ANOVA的F檢定並無影響。判定線性重合的經驗法則： 1. 先看自變數之間的相關係數是否大於0.8或0.9。 2. 如果自變數的個數超過兩個以上，除了相關係數外，還要看各自變數與所有其他自變數之間是否高度相關。作法：另外做自變數間的迴歸估計（見第703頁的第16.5式），並求各估計式的判定係數，然後以VIF（variance inflationary factor）作為判定之標準：亦即，VIF ≥ 10才有線性重合的問題。例如：16.4式為三個自變數的例子 y = α+β1x1 +β2x2 +β3x3 +ε 再估計： x1 = a0 + a1 x2 + a2 x3 x2 = b0 + b1 x1 + b2 x3 x3 = c0 + c1 x1 + c2 x2 然後，求Ri2值，i = 1,2,3，VIFi = 1/(1- Ri2) 若VIF＞10，則 0.95＜|Ri|＜1 例16.1：（第704頁）分析線性重合的問題： 30個公司，1983-1985年（三個樣本）的資料來估計：n=30, k=2 y=PPS， x1=DPS，x2=RE 迴歸估計式如下： 1983: y = 22.773 + 10.733 x1 + 1.431 x2 (F=16.11) (4.15) (4.28) (2.30) 1984: y = 11.336 + 12.434 x1 + 3.088 x2 (F=31.44) (2.33) (4.41) (2.39) 1985: y = 21.529 + 12.553 x1 + 3.014 x2 (F=15.97) (2.81) (3.16) (1.81) 顯著水準：5％ H0：β1=β2=0 H1：β1≠0, orβ2≠0 F檢定的臨界值＝3.35 (F檢定顯示迴歸估計的係數相當顯著。再看：x1 = a0 + a1 x2 的R2值記住：在這裡R2＝r212 =(0.6064)2 因此，VIF=1/[1-(0.6064)2]=1.5815＜10 其VIF遠低於10，故此迴歸模型比較沒有線性重合的問題。 16.3 Heteroscedasticity （異質變異）前面所提之迴歸分析皆為同質變異，即不同樣本點（觀察值）之變異皆相同：σi =σj =σ, i≠j 而此處的變異則隨樣本之不同而有所差異，例如：大廠的營收之迴歸估計誤差的變異大於小廠者，或高收入家庭支出的變異程度常大於低收入者，在現實生活中常可見到此種現象。異質變異的問題所在：最小平方法在估計時，大誤差與大變異的觀察值所給的權數較大，因此，對於誤差與變異較大的部分之觀察值之估計較為理想，反之對於小誤差與小變異的觀察值部分則較不理想，事實上，最小平方法因使用同質變異之假設，故而不能得到使估計誤差的變異數最小之結果。如何辨識異質變異之問題？ 1. 最簡單的方法就是畫圖，觀察誤差項e與自變數（或y的估計/期望值）間的關係。如果資料分散的情形（即離散度）相當一致，則為同質變異，否則，就