第八週.docVIP

下载本文档

6
0
约2.94千字
约 6页
2017-05-07 发布于天津
举报
版权申诉

第八週.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第八週

第八週一變異數分析當我們想分析一個變數的平均數時，我們直接求其平均數並且檢定它是否顯著等於或大於某個值。或者是我們比較不同特徵的樣本在某一變數上的平均值，我們便用t檢定看這些差異是否真的存在。不過，之前的處理方式並未考慮到樣本在某個變數上的變異程度，而且之前的成對檢定只能讓我們檢驗一對對的樣本，若遇到有三個以上的分組，就必須做三次的t檢定，所以我們改採ANOVA(Analysis of Variance)。 ANOVA的虛無假設為每一組的平均數都相等，而檢驗的原則是比較不同組之內的差異，對比於不同組之間的差異。假設分組變數叫做A，而等距尺度的變數為B。如果組之間的差異夠大，而且組之內的差異很小，那麼各組在變數B的平均數的確會是不平等的。如果組之間的差異大，但是組之內的差異更大，組之間的差異有可能是因為分組不佳所造成的，重新分組之後也許差異就不存在了，那麼變數A就無法解釋變數B，而可能是變數C或D比較可以解釋B。當我們要計算樣本在某一變數上的變異數時，可利用這個公式Σ，而計算組間差的公式為： SSB= 其中是各組之間的平均數。經過計算之後， SST = SSE + SSB 從迴歸來思考變異數分析，SSE代表固定每一個X值時，Y的平均數跟其他的Y值之間的距離，就是誤差。而SSB表示每個Y平均數跟全部Y平均數之間的距離，距離越大，表示該變數影響Y越大。組間差的自由度是r-1，也就是分成r組之後再減一。而組內差的自由度則是N-r，而全部平方和則是N-1。計算平均組間差及平均組內差的公式為SSB/N-r及SSE/r-1。得到這兩個統計量後，我們再用MSB/MSE得到F ratio，就可以做F分布檢定。虛無假設為各組間的平均數相等，而自由度為r-1及N-r。在做ANOVA之前，有幾項假設必須滿足。第一，樣本獨立，也就是各分組的樣本沒有互相重覆。第二，變數B對變數A成常態分布，可以用Kolmogorov-Smirnov檢驗。第三是變異數相等，可以用圖形或Levene檢測。第四，依變項必須是等距尺度。 ANOVA分析常用在實驗法，也就是事先把受測者按不同的刺激分組，然後檢驗每一組受測後成績，最後檢視是否不同刺激會造成不同的成績。進一步我們可能要問說，如果平均數不相同，那麼是那幾組之間的平均數不同？我們有各種檢測方式找出平均數的差異。我們的例子是教育程度是否會影響對立法院的信任程度。教育程度有七組，也就是不識字到研究所以上。對立法院的信任程度是0到10分。首先我們檢測是否成常態分配。「分析」(「描述統計」(「預檢資料」。在統計圖的選項下勾選「盒形圖」「結合依變數水準」。並且勾選「常態機率圖附檢定」。檢定結果顯示，我們必須拒斥常態分布的假設。然而在社會科學中，常態分布的態度實在難以測量，只能接受這樣的資料。而下一個盒形圖，則是顯示各教育程度之內的散布程度。依據目視結果，可能有少數幾組有較大的離散程度，需要進一步檢測。我們可以用「分析」(「描述統計」(「預檢資料」，選「統計圖」，然後勾選「冪次估計」這一項，軟體將會轉換依變項及自變項為log變數，轉換之後加以檢驗變異數。見下表，我們可以接受變異數為同質的(homogenous)的假設。做完假設檢定後，我們才開始進行ANOVA分析。「分析」(「比較平均數法」(「單因子變異數分析」來得到變異數分析結果。 F檢定呈現2.432，自由度為6及891，顯著性小於0.05，因此可以說各個教育程度之間在立法委員評估上的確有差異。二 GLM單變量分析當依變項為非連續性變數時，我們可以用GLM單變量分析。它提供許多ANOVA分析的工具，其中包含檢測變異數分析假設的測試，以及比較觀察值平均值的差異，所以我們必須了解它的操作。簡單來說，GLM單變量分析跟單因子變異數分析的用途一樣，都是處理一個因子對一個依變數的關係，只是GLM單變量分析容許我們控制其他的變項，讓我們知道在考慮其他變項情況下，是否依變數會因為該因子不同的類別或分組而有不同的平均值。比方說，一位教授的薪水可能會因為性別不同而有不同的水準，但是也可能受到學歷、專長等而不同，只不過我們假設性別是固定的因子，具有最主要的影響力，而其他變數則只是控制用而已，我們稱為covariate，或共變數。共變數必須要是等距尺度資料。另外有一個隨機變數，這是指我們將根據某個名目變數抽出部份樣本加以分析。以上述例子而言，我們如果有許多學校的資料，可以將學校當做隨機變數，抽出某個學校做分析。選擇「模式」後，會出現「完全因子設計」跟「自訂」。如果要增加因子跟共變量的交互作用進入模型，則可以用建立效果項此一功能建立交互作用項。下方的平方和選項，提供我們四種模式選擇。由於ANOVA涉及分組，各分組之內的觀察值數目