- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
复回归分析简介MultipleRegressionAnalysis回归分析是利用一个
複迴歸分析簡介 (Multiple Regression Analysis)
迴歸分析是利用一個或一組自變數來預測或解釋一個(反)應變數(response variable),其中自變數又可稱為預測變數(predictors)、解釋變數(explanatory variables)、控制變數(controlled variables)、或獨立變數(independent variables)等等,而應變數又可稱為(相)依變數(dependent variable)。在迴歸模式裡,若只有一個自變數,且自變數與應變數的關係為直線相關,則此迴歸模式稱為簡單線性迴歸模式(simple linear regression model);若模式裡至少有二個自變數,且在其它自變數固定之下,每個自變數與應變數的關係是直線相關,則此迴歸模式稱為複迴歸模式(multiple regression model),以下是複迴歸分析的簡介。
A. 複迴歸模式 (Multiple Regression Model):
其中y為應變數,為k個自變數,為(y)截距(intercept),為迴歸係數(coefficients of regression),和為誤差變數或稱為誤差項(error term)。
B. 模式假設 (Model’s Assumptions): 給定為任意值,值獨立 = 不同的y值獨立 (觀察值獨立的假設)
2) 的期望值為0 = y的期望值為 (直線性假設)
3) 的變異數為σ2 = y的變異數為σ2 (同質性(homogeneous)假設)
4) 的機率分佈為常態 = y的機率分佈為常態 (常態分佈假設)
下圖為以簡易線性迴歸來說明此模式的假設:
給定x 為固定值(如圖的x = 10, 20, 或30等等):y的機率分佈皆為常態分佈或鐘狀分佈(如圖的每個紅色曲線);每個常態分佈的形狀大小皆相同---同質性假設;所有對應的y之期望值(或母體平均數)為(如圖y的母體平均數落在綠色直線上,例如當x = 10,y的母體平均數為、)。
C. 估計的迴歸方程式 (Estimated Regression equation):
(注意:此方程式不含誤差項!= y的估計值,= 截距的估計值,分別為迴歸係數的估計值。
又有二種解釋:(1) y期望值(expected value of y)的估計值和(2) y個別值(individual value of y)的估計值。不論是當y期望值的估計值或是當y個別值的估計值,的期望值皆相同為,的變異數在這二種情況下卻不同,的變異數在當作y期望值的估計值比當y個別值的估計值來得小;換言之,雖然兩種情況下的y估計值都相同,但估計y期望值時,變異數較小(較精確),而估計y個別值時,變異數較大(較不精確)。
D. 模式假設的檢查 (Checking Model’s Assumptions):
殘差(residuals) e定義為y觀察值減去y估計值,即,(或標準化的)畫在水平軸和殘差(或標準化的殘差)畫在縱軸。
(1)檢查常態假設:利用殘差(或標準化的殘差),可畫其直方圖,若圖形略似
鐘狀,則無法拒絕常態分佈假設。另外也可畫PP圖,若點分佈愈接近450
度線,則無法拒絕常態分佈假設(如下圖)。
(2) 檢查直線性、同質性和獨立性假設:若殘差圖的點以水平軸為中心散佈,
且水平軸中的不同(或標準化的)值所對應的縱軸殘差(或標準化的殘
差)值約略相同,則無法拒絕模式的直線性、同質性和獨立性假設(如下
圖)。
若殘差值隨值遞增(或遞減),或殘差值隨值上下規則變動,則觀察值不獨立(可能是觀察值與時間有關),如下圖。
若殘差圖呈現「漏斗狀」(如下圖),當值小,殘差變異小(或大)、而當值大,殘差變異大(或小),則同質性假設不成立。
當只有一個自變數時,若殘差圖呈現拋物線狀(如下圖左),則模式應加入高階自變數(如x2)、或呈規則上下變動(如下圖右),則模式應加入更高階自變數(如x3)。
E. 判定係數 (Coefficient of Determination):
迴歸模式裡所有自變數合起來解釋到應變數y之變異的比例,稱為判定係數,用表示,故值介於0到1之間,值愈接近1,表示模式裡所有自變數合起來解釋y之變異愈有貢獻。但的缺點是模式裡加入愈多的自變數,其值愈增加,即使某些自變數本身對解釋y之變異沒有多大貢獻。為了因自變數個數增加,而導致值遞增,我們需把自變數個數納入判定係數的考量裡,而得到調整的(Adjusted ),用表示。註:值不會大於值。當模式有k個
文档评论(0)