- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
社會統計
關秉寅
PAGE
PAGE 8
第十章 假設測定III:變異量(數)分析
(The Analysis of Variance)
本單元目標
舉例說明適用變異量分析的例子
以假設測定的邏輯解釋變異量分析的意義
並以五個假設測定的步驟,從事變異量分析,並解釋測定結果
定義並說明母群體變異量(population variance)、總離均差平方和(total sum of squares)、組間離均差平方和(sum of squares between)、組內離均差平方和(sum of squares within)、均方估計(mean square estimate)、以及事後檢定(post hoc tests)等概念。
說明統計顯著(statistical significance)與變項間關係之重要程度間的差別。
貳、簡介
變異量分析(The Analysis of Variance,英文簡寫為ANOVA)是一非常重要而且常會用到之假設測定的方法。此分析法基本上適用在兩個以上樣本間之比較。我們可以將ANOVA看成是先前學過比較兩個樣本間平均數差異之 t-test 或 z-test 的延伸。例如,我們可能想知道不同宗教信仰者,是否在一測量支持墮胎態度的量表分數上有差異。不同宗教信仰是多類別的自變項。比較這些類別間對某一以等距/比值尺度測量之變項,在平均數上的差異是否達到顯著時,就是一種多樣本比較的情況。
在比較多樣本平均數差異的情況下,我們可以進行一連串兩個樣本間平均數之t-test的測定,如果有四個樣本(從另一個角度來說,是一個有四個類別之自變項,如宗教信仰,則每個類別自為一個independent subsmaple),則我們可進行六個不同之兩個樣本間的t-test。如果真是這樣做,除了非常麻煩外,最大的缺點是會增加犯 Type I 錯誤之機率。如果每個t-test是定在α=0.05之水準下進行測定,一連串這樣的t-tests會使犯下至少一次Type I error的機會增加。換言之,即使每一個t-test是在α=0.05之水準下進行測定,其Type I error綜合起來事實上是大於0.05。換個角度來說,t-test做多了,總有一個t-test之結果會reject HO,但此HO可能為真。用ANOVA來分析就可以避免這樣的問題。
貳、ANOVA之原理
ANOVA之虛無假設H0是μ1=μ2=μ3=……=μk,也就是所有樣本均是來自同一母群,或是各樣本來自的各個母群在平均數上沒有無差異。更具體的說法是每類別或項目間在某一特性上並無差異(如:不同宗教信仰者在支持墮胎之態度上並無差異)。從這H0之型式可看出是兩樣本間t-test之延伸。至於說H1則為「至少有一類別在某一特性上與其它類別有差異」。
如果上述之H0為真,則每類別樣本平均數之差別應不大,且各樣本之標準差大小差不多(見書中P. 252之Table 10.1)(如果由同一母群體中抽出多個樣本是否有同樣的結果?)。事實上ANOVA並不是問不同類別間是否有差異,因為即使是虛無假設為真,由於抽樣或測量的過程中會有誤差,所以會實際觀察到各類別的平均數不同。因此,我們是在問:這些差異是否大到可以拒絕H0。
和H0完全相反的情況是各類別之平均數相差極大,而各類別之標準差很小。換言之,各類別內之異質性很小,而類別間異質性很大(見P. 252之Table 10.2)。在這種情況下,如果我們將所有樣本合併,這個合併後之樣本的變異量(Variance)(Variance如何計算?有何意義?),主要來自原來樣本和樣本間之差異。換言之,此合併後樣本之變異或離散之狀況主要源自原來各樣本間之差異。而H0所假設的情況,是變異量主要是來自原各樣本(類別)內之差異,而非各樣本間之差異。
※了解上面的敘述後,就很容易了解ANOVA之原理,ANOVA之測定是建立在比較各類別(或樣本)間之變異量及各類別內之變異量。與類別內之變異量相比較下,當類別間之變異量愈大時,拒絕H0之可能性愈大,反之,則愈小。
ANOVA之公式,即在比較兩種對母群體之變異量(σ2)之估計值。其一估計值即是建立在各樣本內之變化,而另一則為樣本間之變化。這即是ANOVA(ANalysis Of VAriance)之名稱的由來。
參、ANOVA之計算
要做ANOVA之測定需要介紹一些新概念及統計。第一個新概念是變項分數之總離散的程度,這是由總離均差平均和(total sum of squares 或 SST)來測量。計算SST是要將所有各樣本合併,然後計算所有分數離散之狀況,在此測量離散之方法是用下列公式
SST=Σ(Xi-eq \x \to(X))2 ----(1)
總
原创力文档


文档评论(0)