多元(复)回归分析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元(复)回归分析.doc

多元(複)迴歸分析 (Multiple Regression Analysis) 利用OLS(ordinary least squares)來做多元迴歸可能是社會學研究中最常用的統計分析方法。利用此法的基本條件是應變項為一個分數型的變項(等距尺度測量的變項),而自變項之測量尺度則無特別的限制。當自變項為類別變項時,我們可依類別數(k)建構k-1個數值為0與1之虛擬變項(dummy variable)來代表不同之類別。因此,如果能適當的使用的話,多元迴歸分析是一相當有力的工具。 多元迴歸分析主要有三個步驟: ─ 第一、利用單變項和雙變項分析來檢視各個準備納入複迴歸分析的變項是否符合OLS線性迴歸分析的基本假定。 ─ 選定迴歸模式,並評估所得到的參數估計和適合度檢定(goodness of fit)。 ─ 在我們認真考慮所得到的迴歸分析結果前,應做殘餘值(residuals)之診斷分析(diagnosis)。但通常我們是先確定迴歸模式之設定(specification)是否恰當後,才會做深入之殘餘值分析。 迴歸分析的第一步是一一檢視每個即將納入迴歸分析模式的變項。首先,我們必須先確定應變項有足夠的變異(variability),而且是接近常態分配(迴歸係數的估計並不要求應變項是常態分配,但對此估計做假設測定時,則是要求殘餘值應為常態分配。而應變項離開常態分配的狀態很遠時,殘餘值不是常態分配的可能性增大)。其次,各自變項也應該有適當的變異,並且要瞭解其分配之形狀和異常的個案(outlying cases;outliers)。 我們可用直方圖(histogram)和Normal P-P(probability plot)圖等來測定應變項是否拒絕其為常態分配的假設,以及是否有異常之個案。同樣的,我們可用直方圖和其他單變項之統計來檢視各個自變項之分配形狀、程度,以及異常個案等。 在SPSS中,我們可用Analyze內的Descriptive Statistics中的Explore來得到上述之統計和圖。 做雙變項相關之分析之主要目的是檢視變項間之關係是否為線性關係(linearity)和是否為共線性(collinearity)之情況。最基本的作法是看雙變項之相關矩陣。如果應變項與自變項間之關係很弱或比自變項間之相關弱的話,就應質疑所設定之多元迴歸模式是否適當。 檢視自變項與應變項間是否為線性關係的基本作法是看雙變項間之散佈圖(scatter plot)。進階且比較好的作法是在控制其他自變項後,再看某一自變項與應變項間之部分線性關係(partial linearity)。線性關係是迴歸分析重要的假定,而且指的是自變項與應變項間之部份線性關係。我們並不用太關心自變項間是否為線性關係,但如對自變項間關係之設定有誤時,也會導致我們對虛假關係不適當的控制和解釋上的錯誤。 探索自變項與應變項間部分線性關係的方式是在控制其他自變項後,逐一檢視某一自變項及進一步加入此自變項之平方後,看看兩個迴歸模式間是否達顯著之差異。如果是的話,則此自變項與應變項間之關係並不是線性關係。當發現自變項與應變項間並非線性關係時,除了將該自變項之平方加入迴歸分析的方法外,也可將該自變項做對數轉換(log transformation),例如我們常將個人之收入做對數轉換之處理。究竟如何處理是適當的,是以理論為基礎。 在SPSS中,我們可用Analyze內之Correlate中的Bivariate及Graphs中的Scatter來得到雙變項之相關矩陣及散佈圖。部份線性相關之檢視則需用到Transform內的Compute來建構一個變項的平方,然後用Analyze內之Regression中的Linear來檢視。 在決定迴歸分析的模式後,我們應進一步檢視自變項間是否有多元共線性(multicollinearity)的問題,也就是自變項間是否有高度相關的問題。如果自變項間高度相關的話,會影響到對迴歸係數之假設測定。我們可以用因素分析來檢查自變項間是否有多元共線性,或者是逐一將某一自變項(當成為應變項)和所有其他自變項做多元迴歸分析。 在以SPSS做迴歸分析時,我們也可在其Statistic之選項中選擇partial correlation與collinearity之統計。SPSS所提供之collinearity的統計包括Tolerance、VIF(variance inflation factor)和Condition Index等。這些統計是有關連性的。如Tolerance與VIF就是互為倒數,如果是Tolerance越小,就表示該自變項與其他自變項間之共線性越高或幾乎是其他自變項的線性組合。 如果自變項是類別的變項,我們可以將這些類別一一建構成為虛擬變項。依照類別數目(k),我們只需

文档评论(0)

gtez + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档