- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
邱皓政2007统计原理与分析技术14__类别变项的关联分析.ppt
讓數字會說話三F 類別變項的關聯分析 Analysis of Association among Categorical Variables 關聯分析的基本要素 關聯強度(strength) 反應兩個變項關聯情形的強弱 兩個變項的關聯強弱可以利用特殊的統計量(關聯係數)來表示 當係數的數值越大,表示強度越強,當係數的數值越小,表示強度越弱 關聯方向(direction) 正向關聯(positive association):兩個變項數值的變動具有相同的方向時(以正號+來表示) 負向關聯(negative association):當兩個變項數值的變動為相反的方向時(以負號-來表示) 關聯模式(pattern) 兩個變項關聯情形的型態(例如直線關係、曲線關係 ) 變項間的次序或角色關係的對稱性 非對稱關係(asymmetrical relationship): 當兩個變項之間,有明顯的次序關係或預測關係時。例如年齡與工作能力的關係。 對稱關係(symmetrical relationship):兩變項關係沒有清楚的前後次序或因果關聯時,只能觀察到兩個變項的連動情形,例如焦慮與學習表現的關係 類別變項的關聯分析 類別資料的分析 類別資料的產生 原發性類別資料:當被測定的變項的本質是名義性的屬性, 例如性別資料 操弄性類別資料:以人為操作的手段所獲致的分類性資料, 例如實驗操弄的分類結果 虛擬化類別資料:由其他類型的資料型態轉換成類別形式的資料, 例如由連續變項轉換來的類別變項 類別資料的基本型態 次數與百分比 類別資料的呈現 次數分配表與列聯表 類別資料的分析 卡方檢定與其他關聯性分析法 列聯表 列聯表為兩個單一類別變項的次數分配表的整合呈現 直行(column)變項以X表示,橫列(row)以Y表示 如果X變項具有k個水準,Y變項具有l個水準,稱為k×l列聯表 邊際分配﹙marginal distribution﹚ 列聯表的側緣數據(右側及下方的次數分配),反應兩個變項的次數分配狀況,也就是兩個獨立的次數分配表 細格次數 邊際次數所包夾的區域稱為細格﹙cells﹚,反應兩個變項的互動關係 兩個類別變項是否具有關聯性,就是在檢查各細格當中次數的變化情形 殘差分析(residual analysis) 殘差分析 各細格期望次數與觀察次數的差值的分析 期望值(以 表示) 是各細格所相對應的兩個邊際人數百分比(Pi.與P.j)的乘積乘以總人數 在特定邊際次數的條件下,兩個變項無關聯時,細格次數在隨機情況下的最可能值,或稱為最大概似(maximum likelihood)期望值 殘差(residual) 各細格實際觀察人數減去期望人數,又稱為Δ(delta)值 殘差越大,各細格分佈越不如期望般的出現,兩個變項有某種關聯,殘差越小,表示各細格分佈越接近期望,兩變項無關聯 正殘差值表該細格的觀察次數高於兩個變項無關時的期望值 負殘差值表該細格的觀察次數低於兩個變項無關時的期望值 標準化殘差(standardized residual) 標準化殘差 殘差為未標準化統計量數。將殘差除以標準誤,得到標準化殘差 將標準化殘差平方後加總,即得Pearson ?2,也就是我們常用的卡方值 Δ’分佈呈標準化常態分配N(0,1),可利用常態化Z分配進行統計決策 調整後標準化殘差(adjusted standardized residual) 標準化殘差會隨著邊際期望值的大小變動而產生波動 若將標準化殘差以各邊際比率進行調整,得到調整後標準化殘差,可以排除各邊際次數不相等所造成的比較問題 卡方考驗 卡方考驗 將樣本統計量轉換成卡方值,配合卡方分配所進行的統考驗 原理是以細格次數來進行交叉比較,俗稱交叉分析 χ2值的大小,代表統計量與理論值的差異程度,一旦χ2值大於顯著水準的臨界值,即表具有統計意義 殘差分析是卡方考驗顯著後的事後考驗程序 卡方考驗顯著之後,再以殘差分析來檢驗各細格的狀況 小樣本的卡方檢驗 當樣本很小時,以上述卡方公式所導出的數值僅是一個卡方近似值,而非真正卡方分配下的數值。 小樣本應使用校正值,例如耶茲校正(Yate’s correction for continuity)或費雪正確機率考驗(Fisher’s exact probability test) 前後測資料,應使用麥內瑪考驗(McNemar test) 卡方導出關聯係數 Phi(?)係數 反應兩個二分類別變項(例如類別為男女、是否的類別變項)的關聯性係數 ?係數與卡方值之間具有可轉換的數學關係 ?係數係修正了樣本數對於卡方值的影響,開根號之後,?係數即等同於Pearson’s r,數值介於-1至1
文档评论(0)