- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八週
第八週
一 變異數分析
當我們想分析一個變數的平均數時,我們直接求其平均數並且檢定它是否顯著等於或大於某個值。或者是我們比較不同特徵的樣本在某一變數上的平均值,我們便用t檢定看這些差異是否真的存在。不過,之前的處理方式並未考慮到樣本在某個變數上的變異程度,而且之前的成對檢定只能讓我們檢驗一對對的樣本,若遇到有三個以上的分組,就必須做三次的t檢定,所以我們改採ANOVA(Analysis of Variance)。
ANOVA的虛無假設為每一組的平均數都相等,而檢驗的原則是比較不同組之內的差異,對比於不同組之間的差異。假設分組變數叫做A,而等距尺度的變數為B。如果組之間的差異夠大,而且組之內的差異很小,那麼各組在變數B的平均數的確會是不平等的。如果組之間的差異大,但是組之內的差異更大,組之間的差異有可能是因為分組不佳所造成的,重新分組之後也許差異就不存在了,那麼變數A就無法解釋變數B,而可能是變數C或D比較可以解釋B。
當我們要計算樣本在某一變數上的變異數時,可利用這個公式Σ,
而計算組間差的公式為:
SSB=
其中是各組之間的平均數。經過計算之後,
SST = SSE + SSB
從迴歸來思考變異數分析,SSE代表固定每一個X值時,Y的平均數跟其他的Y值之間的距離,就是誤差。而SSB表示每個Y平均數跟全部Y平均數之間的距離,距離越大,表示該變數影響Y越大。
組間差的自由度是r-1,也就是分成r組之後再減一。而組內差的自由度則是N-r,而全部平方和則是N-1。計算平均組間差及平均組內差的公式為SSB/N-r及SSE/r-1。
得到這兩個統計量後,我們再用MSB/MSE得到F ratio,就可以做F分布檢定。虛無假設為各組間的平均數相等,而自由度為r-1及N-r。
在做ANOVA之前,有幾項假設必須滿足。第一,樣本獨立,也就是各分組的樣本沒有互相重覆。第二,變數B對變數A成常態分布,可以用Kolmogorov-Smirnov檢驗。第三是變異數相等,可以用圖形或Levene檢測。第四,依變項必須是等距尺度。
ANOVA分析常用在實驗法,也就是事先把受測者按不同的刺激分組,然後檢驗每一組受測後成績,最後檢視是否不同刺激會造成不同的成績。
進一步我們可能要問說,如果平均數不相同,那麼是那幾組之間的平均數不同?我們有各種檢測方式找出平均數的差異。
我們的例子是教育程度是否會影響對立法院的信任程度。教育程度有七組,也就是不識字到研究所以上。對立法院的信任程度是0到10分。
首先我們檢測是否成常態分配。「分析」(「描述統計」(「預檢資料」。在統計圖的選項下勾選「盒形圖」「結合依變數水準」。並且勾選「常態機率圖附檢定」。
檢定結果顯示,我們必須拒斥常態分布的假設。然而在社會科學中,常態分布的態度實在難以測量,只能接受這樣的資料。而下一個盒形圖,則是顯示各教育程度之內的散布程度。依據目視結果,可能有少數幾組有較大的離散程度,需要進一步檢測。
我們可以用「分析」(「描述統計」(「預檢資料」,選「統計圖」,然後勾選「冪次估計」這一項,軟體將會轉換依變項及自變項為log變數,轉換之後加以檢驗變異數。見下表,我們可以接受變異數為同質的(homogenous)的假設。
做完假設檢定後,我們才開始進行ANOVA分析。「分析」(「比較平均數法」(「單因子變異數分析」來得到變異數分析結果。
F檢定呈現2.432,自由度為6及891,顯著性小於0.05,因此可以說各個教育程度之間在立法委員評估上的確有差異。
二 GLM單變量分析
當依變項為非連續性變數時,我們可以用GLM單變量分析。它提供許多ANOVA分析的工具,其中包含檢測變異數分析假設的測試,以及比較觀察值平均值的差異,所以我們必須了解它的操作。
簡單來說,GLM單變量分析跟單因子變異數分析的用途一樣,都是處理一個因子對一個依變數的關係,只是GLM單變量分析容許我們控制其他的變項,讓我們知道在考慮其他變項情況下,是否依變數會因為該因子不同的類別或分組而有不同的平均值。比方說,一位教授的薪水可能會因為性別不同而有不同的水準,但是也可能受到學歷、專長等而不同,只不過我們假設性別是固定的因子,具有最主要的影響力,而其他變數則只是控制用而已,我們稱為covariate,或共變數。共變數必須要是等距尺度資料。
另外有一個隨機變數,這是指我們將根據某個名目變數抽出部份樣本加以分析。以上述例子而言,我們如果有許多學校的資料,可以將學校當做隨機變數,抽出某個學校做分析。
選擇「模式」後,會出現「完全因子設計」跟「自訂」。如果要增加因子跟共變量的交互作用進入模型,則可以用建立效果項此一功能建立交互作用項。下方的平方和選項,提供我們四種模式選擇。由於ANOVA涉及分組,各分組之內的觀察值數目
您可能关注的文档
最近下载
- 农业合作社全套报表(已设公式)--资产负债表-盈余及盈余分配表-成员权益变动表-现金流量表.xls VIP
- C语言程序设计PPT电子课件教案-04_循环语句嵌套及应用.ppt VIP
- 财务新纪元:现状与展望-探索财务工作的挑战与未来.pptx
- GB50496-2018 大体积混凝土施工标准.pdf VIP
- ZW8100喷水织机使用说明书2.pdf
- 冬季极端天气安全知识培训课件.pptx
- 整理bpmfdtnl单韵母拼读.doc VIP
- 南京市总工会2025年公开招聘笔试题(含答案)(DOC).doc VIP
- 中国国家标准 GB/T 42588-2023系统与软件工程 功能规模测量 NESMA方法.pdf
- 人教版初中必背古诗文.doc VIP
原创力文档


文档评论(0)