两个类别变数的关连分析-社会统计.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
两个类别变数的关连分析-社会统计

社會統計 第八講 兩個類別變數的關連分析 Analyzing Association between Categorical Variables 社會學研究往往會對下列問題有興趣 不同族群的政黨偏好是否有所不同? 左右政黨所選擇的國民健康體制(市場、全民健保、公費醫療) 不同社會運動團體(宗教、弱勢、環保、勞工)所選擇的運動策略(服務、倡議、動員抗議) 性別與慈善行為 教育程度與宗教信仰 以上的變數都是類別變數(包括名目和順序變數) 研究所要關心的是兩個類別變數的關聯 關聯Association 當依變數隨著自變數的改變而改變時,兩個變數間存在著關聯性(但這不一定是因果關係)。 Exp.左派政黨執政的國家偏向非市場的國民健康體制,而右派政黨執政的國家則大部分交由醫療市場來決定。 Exp.男性在投資選擇上傾向投資股票,而女性則選擇銀行定存。 Exp.宗教與所選擇的職業類型 Exp.專業人士欣賞爵士樂,布爾喬亞聆聽古典音樂,而勞工階級喜歡搖滾樂(階級與藝術品味) 列聯表contingency tables 我們可以用列聯表來展現兩個類別變數之間的關係。 列聯表contingency tables 從這個列聯表裡我們不容易一眼看出兩個變數之間的關係。 轉換成百分比。 獨立與相依independence dependence 在上表中,我們主要關心的是族群和宗教之間是否有相關性? 這是探討兩個變數是互相獨立還是彼此相依。 如果不同族群的宗教信仰分佈百分比完全相同,則兩個變數在統計上來說是互相獨立的。 反之則為彼此相依,或說是有相關性。 兩樣本獨立的卡方檢定 隨著樣本的不同,變數的類別間的次數分配可能不是完全相等,會有差距。 在多大的偏差範圍內我們會認為兩個變數之間是互相獨立的? 需要一個檢定統計量來幫助我們作判斷。 兩個假設如下: H0:變數之間互相獨立 H1:變數之間彼此相關 期望次數與觀察次數 就像所有的假設檢定一樣,我們分析如果虛無假設H0為真,會產生一個期望的值(比如說u=0)。 我們把這個期望值和實際觀察得到的值作比較。 期望和觀察的差異是否大到讓我們必須要拒斥虛無假設? 變數間獨立性的卡方檢定 在兩變數獨立性檢定時,我們討論期望次數(expected frequencies)和觀察次數(observed frequencies)的差別。 fo是實際觀察到次數 fe是預期觀察到次數 fe預期次數的計算 我們首先要計算預期次數 fe預期次數的計算 Exp.本省閩南信奉佛教這一個格子(cell)的預期次數是(512*1438)/1906=386.3,也就是說如果族群跟宗教信仰無關的話我們會在這個格子裡觀察到386.3個人 Chi-Squared Test Statistic 變數間獨立性的卡方檢定是因為在大樣本時,檢定統計量呈現卡方分配而得名。 卡方分配 卡方分配的基本特質 Chi-square的值恆為正,最小的值為零(當每一格裡的fo = fe時 ,也就是當樣本裡兩個變數完全獨立時)。 卡方分配是一個右偏的分配。 其自由度df=(r-1)(c-1),也就是欄數減一乘以列數減一。 u=df,σ=√2df 當自由度越大,卡方分配曲線越接近常態分配曲線 卡方分配定理 卡方分配定理 Let Z1, Z2, …Zυ be independent standardized normal variables. Then 卡方分配的性質 ?卡方分配為一定義在大於等於0(正數)範圍的右偏分配, 不同的自由度決定不同的卡方分配。 卡方分配的性質 ?卡方分配只有一個參數即自由度,表為ν。卡方分配的平均數與變異數為: ?卡方分配隨著自由度增加而逐漸趨於對稱,當自由度趨近於無窮大時,卡方分配會趨近於常態分配。 卡方分配的性質 卡方分配的加法定理 二個獨立的卡方隨機變數相加所得之隨機變數仍為卡方隨變數,其卡方分配的自由度為二個卡方分配的自由度之和。 查表練習 df = 10, 求χ20.005=? df = 10, P(χ2 19.8) =? 查表練習 樣本大小的要求 每一個格子裡的期望次數使少要有5以上。 要不然,檢定統計量的分配就無法逼近於卡方分配。 獨立性卡方檢定的要素 假設: 兩個類別變數 隨機樣本 所有格子裡的期望值至少為5(不然用小樣本的exact test) 虛無假設與對立假設 H0:變數間在統計上互相獨立 H1:變數間在統計上互相依賴 檢定統計量 獨立性卡方檢定的要素 P值,P=根據卡方分配,比所得到的x2還大的機率,這個卡方分配的自由度df=(r-1)(c-1) 結論:報告P值,如果P≦α則在α的顯著水準下可以拒斥虛無假設。 解釋自由度 既使在上表的情況下,我們也可以算出空白格子的數值。所以可以說這些格子是不自

文档评论(0)

dajuhyy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档