- 1、本文档共126页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ming-chichen
14.1.1 模型設定錯誤-遺漏 Model Specification Errors 14.1.2 模型設定錯誤-加入不相關變數 Model Specification Errors-including irrelevant IV 加入不相關的自變數 正確的迴歸模型為: Y=α+βX+ε 放入不相關的解釋變數Z Y=α*+β*X+γ*Z+ε* 自變數設定錯誤的問題:放入不相關的變數 14.2 線性重合與其他問題 非線性迴歸模型:自變數的其他轉換 在第一格填入0.01 非線性迴歸模型:自變數的其他轉換 非線性迴歸模型:自變數的其他轉換 把這個資料存成以TAB字元相隔的文字檔。 在Stata中匯入這個資料 非線性迴歸模型:自變數的其他轉換 對數關係與線性關係 用線性關係來分析這筆資料 R2=0.77,整個模型顯著,迴歸係數為0.59,亦為顯著 對數關係與線性關係 對數關係與二次方關係 用二次方迴歸模型來分析 R2=0.91,整個模型顯著;迴歸係數皆顯著 v2=-1.68+1.56*v1-0.19*v12 對數關係與二次方關係 二次方關係 多次方轉換容許等差尺度的變數 大部分其他函數轉換則需要等比尺度的變數 非直線關係:轉換依變數 轉換依變數會改變自變數與依變數的關係,轉換後兩者的關係不再適合用線性關係來分析 這必須用概化線性模型(generalized linear model, GLM)來分析,而OLS可被視為是GLM家族中的一員 ?Ming-chi Chen 社會統計 Page.* 如何處理Heteroscedasticity? It has to be pretty severe before it leads to serious bias in the standard errors. ?Ming-chi Chen 社會統計 Page.* Outlier的影響 OLS很容易受到離群值(outlier)的影響,尤其當樣本不大的時候。 有很多的統計技術可用來檢驗每個obs對於迴歸模型的影響。 主要是討論如果我們刪除了某個觀察個案,對於模型的參數會有何影響。 個案的影響力取決於下列兩個條件: 個案觀察到的Y值跟預測值有多大的落差 個案在IV上有多極端(離均值) ?Ming-chi Chen 社會統計 Page.* Studentized residual 第一個方法是先求殘差 殘差越大,就表示該觀察值離整體趨勢越遠多遠?可以用標準化轉換。 這稱為studentized residual 如果絕對值2.5就要小心 ?Ming-chi Chen 社會統計 Page.* Stata Studentized residual 先跑迴歸,用前面income和consumption的例子。 Predict 新變數名稱, rstudent 自行定名 ?Ming-chi Chen 社會統計 Page.* Hat value or leverage 個案在某IV的值離這個IV的均數有多遠 hat value越大,在計算預測值Y-hat時的權重就越大,它的槓桿也越大。 hat value的平均是p/n,p是模型裡的參數數量。 hat value隨著樣本變大而變小。 3p/n表示有大的槓桿 ?Ming-chi Chen 社會統計 Page.* hat value (leverage) Stata Predict 新變數名稱, hat (3*2)/20 ?Ming-chi Chen 社會統計 Page.* DFFIT 有兩個常用的診斷統計量:DFFITS和DFBETAS DFFITS:去除了個案對model fit的影響,也就是how much the predicted value for each obs would change. ?Ming-chi Chen 社會統計 Page.* DFFIT Stata Predict 新變數名稱, dfits ?Ming-chi Chen 社會統計 Page.* DFBETAS 移除個案後迴歸係數的改變,除以調整過後的資料組的估計式標準誤。 >1表示個案有重大影響 ?Ming-chi Chen 社會統計 Page.* DFBETAS Stata predict 新變數名稱, dfbeta(所選的自變數) 分別選擇自變項 1 ?Ming-chi Chen 社會統計 Page.* DFBETAS Stata Dfbeta不用指定自變項 只有一個自變數,所以只有一個DF值,注意Stata變數命名 ?Ming-chi Chen 社會統計 Page.* 移除離群值重跑迴歸 reg consum income if abs(DFincome) 1 新迴歸方程式: c
文档评论(0)