网站大量收购独家精品文档,联系QQ:2885784924

肆 卡方獨立性檢定 與 變數間的關聯性檢定 -.ppt

肆 卡方獨立性檢定 與 變數間的關聯性檢定 -.ppt

  1. 1、本文档共64页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
肆 卡方獨立性檢定 與 變數間的關聯性檢定 -

公共管理與政治學研究方法研討班 陸 卡方獨立性檢定 與 變數間的關聯性檢定 主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 變數之間關係的描述 一、卡方獨立性檢定 二、關聯性的統計 一、卡方獨立性檢定 在一般民意調查或是社會科學中, 最常使用的統計方法。 卡方獨立性檢定的基本原則與程序 ?基本原則是檢視觀察值與期望值之間的差異,是否達到統計上的顯著程度。 如果具有顯著差異,則再進一步解釋差異的來源。 「南人食米、北人食麥」的卡方獨立性檢定 我們就以「南人食米、北人食麥」為例 按步就班分解卡方獨立性檢定 ? 我們統計上的虛無假設是: 居住地區與飲食習慣之間是互相獨立的,沒有任何關聯。 1.先列出兩個變數的次數(或是百分比)分配 2. 假設兩個變數彼此獨立,並找出其期望值(E) 3. 觀察值的實際分佈(O) 4. 計算觀察值與期望值之間的差異(O-E) 5. 計算每一個格子的卡方值 6.???加總所有格子內的卡方值 加總所有卡方值,我們得到=37.5 7. 自由度的計算方式: df = (c-1) (r-1)=(2-1)*(2-1)=1 r = row 橫列的類別數目 c = column 直欄的類別數目 8. 查表 卡方檢定表 得到p0.001,所以拒絕虛無假設。 *: p0.05 **: p0.01 ***: p0.001 卡方獨立性檢定的解釋程序 1.做卡方檢定,確定變數間的關係是否獨立。 2.以調整後餘值,觀察特定格子是否顯著偏高/低。 3.具體解釋表格內的百分比。 調整後餘值 / 殘差的運用與解釋 調整後餘值的分布是接近標準常態分配,平均數為0而標準差為1。 通常絕對值大於等於1.96時,表示該細格與其他觀察值之間具有顯著差異,其正負值則表示該細格出現的頻率顯著偏高或顯著偏低。 若是其值落在正負1.96之間時,則表示該細格出現的頻率僅略高或是略低。 調整後餘值 不同地區民眾飲食習慣差異的卡方檢定 表4-4 2000年總統大選省籍與投票對象的卡方獨立性檢定 調整後餘值 2000年總統大選省籍與投票對象卡方獨立性檢定 研究問題: 統計的虛無假設 統計的對立假設 2000年總統大選省籍與投票對象卡方獨立性檢定 統計描述: 從範例表三中我們發現:卡方檢定的p值小於0.05,顯示我們得以拒絕虛無假設,民眾的省籍與投票對象之間並不獨立。 論文的說明: 本研究在於分析:民眾的省籍背景與投票對象之間的關聯性,在卡方檢定中我們發現兩者關係並非獨立,進一步檢視,我們發現:相對於全體選民,本省客家的民眾對於宋楚瑜的支持略高,約達四成;對於連戰的支持程度也略高,接近三成,不過,他們對於陳水扁的支持程度顯著偏低,僅不及三分之一。 卡方獨立性檢定進行前的注意事項 需要注意的是,在進行卡方檢定時,一般的要求是每一個細格的期望值應大於或等於5,也有學者加以放寬到最小的期望值大於或是等於1。此外,小於5的細格數的比例不能超過所有格子數的20%,以免因為樣本過少而影響推論。細格太多,通常需要先做類目合併。 勝算(odds)與勝算比(odds ratio) 勝算/成敗=(成功機率)/(失敗機率) 2*2表格的勝算比 女性中,投給馬英九相對謝長廷的「勝算」(odds)=491/246=2.00 男性中,投給馬英九相對謝長廷的「勝算」(odds)=415/288=1.44 女性投給馬英九相對於謝長廷的勝算是男性(投給馬英九相對於謝長廷的勝算)的1.39倍 機率與勝算的轉換 機率=(odds)/(odds+1) 女性中,投給馬英九相對謝長廷的「勝算」(odds)=491/246=2.00 女性投給馬英九的機率:2/(2+1)=0.666 二、關聯性的統計 1 名目變數間的關聯性分析 2 順序變數間的關聯性分析 3 等距變數間的關聯性分析 1 類別變數間的關聯性分析 一種常用的相關性測量為 Goodman and Kruskal’s Lambda 測量。 這是屬於一種誤差降低率 (proportional reduction of error,或是 PRE) 的相關性測量。其值的分布從0到1。 基本概念是: 當知道一個變數之後, 可以減低我們預測另外一個變數所犯錯誤的比例。 表4-5 2000年總統大選不同省籍選民投票的交叉列表 Lambda 相關性測量實例 如果沒有選民省籍背景的資料(變數X)的相關資訊的話,X,我們預測選民的投票傾向(Y)的最佳方法是運用眾數,使我們的誤差減低到最小,所以,其誤差為=0.581。這是我們預測所有選民都投給陳水扁時,所得到的誤差

文档评论(0)

精华文库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7111022151000002

1亿VIP精品文档

相关文档