类别资料的分析.ppt

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
类别资料的分析

統計學 郭信霖 許淑卿 第十章 類別資料的分析 10-1 類別資料 10-2 適合度檢定 10-3 獨立性檢定 10-4 齊一性檢定 10-5 電腦範例 10-6 流程圖 10-1 類別資料(categorical data) 有關類別資料的整理:列聯表(contingency table)及所使用的統計分析方法:卡方檢定(Chi-square testing)。 一、基本概念 在前面樣本比例之抽樣分配時,曾說明當樣本夠大時,可使用常態分配。 Z = ~N(0, 1) 設Y1,Y2為重覆n次二項試驗中發生成功與失敗的觀測次數,其發生的機率分別為p1,p2,Y1 + Y2 = n,且p1 + p2 = 1,並取e1,e2為期望次數。 則統計量Z 2 = = = + = + = 由機率理論,可證明得知 ? 2 = Z 2 = ~? 2(1) 統計量 ? 2 = = - n ~ ? 2(v) 樣本資料須符合下列條件: (1) 由母體隨機抽樣產生的資料。 (2) 每類試驗結果皆為互斥且互補。 (3) 理論期望次數ei ? 5。 而且自由度v計算如下: (1)v = k - 1 表示由H0中的假設值直接計算期望次數。 (2)v = k - 1 - m(其中m表由樣本資料估計母體參數的個數) 表示先估計m個參數後,才能由H0的假設值計算期望次數。 若? 2值愈大,則表示樣本觀測次數與理論期望次數之間的差異很大,故拒絕區域為 CR = { ? 2 (v) },v = k - 1或k - 1 - m 二、類別資料的整理 1. 單向列聯表(one-way contingency table)。 2. 雙向列聯表(two-way contingency table)。 3. 三向列聯表(three-way contingency table)。 四種常用的卡方檢定: (a) 適合度檢定(goodness of fit test) ?? 多項式母體比例的檢定(test of multi-nominal population proportion)。 ?? 檢定母體的分配。 (b)列聯表: ?? 獨立性檢定(test of independence) ?? 齊一性檢定(test of homogeneity) 10-2 適合度檢定(goodness of fit test) 一、基本觀念 適合度檢定主要分為兩大類: (1) 多項式母體比例的檢定 (2) 母體機率分配的檢定 其所用的檢定統計量為 ? 2 = ~? 2(v),v = k - 1或k - 1 - m 二、檢定步驟 1. 假設: 多項式母體比例的檢定 母體機率分配的檢定 2. 拒絕區域: CR = { ? 2 (v) },v = k - 1或k - 1 - m 3. 檢定統計量: ? 2 = 當n足夠大時,? 2~? 2(v),通常只要ei ? 5,i = 1, 2, …,k;若有期望次數ei 5的類別,就須和鄰近的類別合併成一個ei ? 5的類別。 4. 在H0下,計算檢定統計量的值: = ,ei = pi0,i = 1, 2, …, k 5. 結 論: (1) 若 ?CR,則拒絕H0;否則不拒絕H0。 (2) 求p-值= P ( ? 2 ) 若p-值 ?,則拒絕H0;否則,不拒絕H0。 10-3 獨立性檢定(test of independence) 一、基本概念 獨立性檢定主要是將一個母體按兩種不同的屬性,並探討這兩種不同屬性之特徵是否為獨立的質的變數(qualitative variable)。 設由一個母體資料中,隨機抽出n個樣本資料,按A、B兩個不同的屬性分類,則所形成的r?c列聯表如下: 其中Yij表樣本資料中含Ai與Bj兩個屬性的次數 Ri =表樣本資料中含Ai屬性的次數 Cj =表樣本資料中含Bj屬性的次數 n = = = 設pij表示同時含Ai,Bj的比例,pij = P(Ai ?Bj ) pi.表示含Ai的比例,pi. = P(Ai ) = p.j表示含Bj的比例,p.j = P(Bj ) = 二、檢定步驟 1. 假設: 或 2. 拒絕區域: CR = { ? 2 (v) },v = (r - 1)(c - 1) 3. 檢定統計量: ? 2 = = - n

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档