- 1、本文档共61页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[数学]第八章 卡方检验1
第八章 ?2检验Chi-square test 用样本信息推论总体特征的过程。 包括: 参数估计: 运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。 假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。 例 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见下表,问铅中毒病人与对照人群的尿棕色素阳性率差别有无统计学意义? ?2检验(Chi-square test)是现代统计学的创始人之一,英国人K . Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法。 ?2 检验的用途 用途较为广泛的假设检验方法,本章仅介绍用于分类计数资料的假设检验,用于检验两个(或多个)率或构成比之间差别是否有统计学意义,配对?2检验检验配对计数资料的差异是否有统计学意义。 ?2检验的基本思想 检验实际频数(A)和理论频数(T)的差别是否由抽样误差所引起的。也就是由样本率(或样本构成比)来推断总体率或构成比。 衡量理论频数与实际频数的差别 理论频数的计算 χ2检验的基本公式 ?2分布的形状依赖于自由度ν 的大小: ① 当自由度ν≤2时,曲线呈“L”型; ② 随着ν 的增加,曲线逐渐趋于对称; ③ 当自由度ν →∞时,曲线逼近于正态曲线。 如果假设检验成立,A与T不应该相差太大。 理论上可以证明 ?(A-T)2/T服从x2分布,计算出x2值后,查表判断这么大的x2是否为小概率事件,以判断建设检验是否成立。 自由度一定时,P值越小, x2值越大,反比关系。 当P 值一定时,自由度越大, x2越大。 ?=1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63 P=0.05时, ?=1, x2 =3.84 ?=2, x2 =5.99 四格表?2检验的专用公式 为了不计算理论频数T, 可由基本公式推导出 ,直接由各格子的实际频数(a、b、c、d)计 算卡方值的公式: 1.建立检验假设 若检验假设H0:π1=π2成立,四个格子的实际频数A 与理论频数T 相差不应该很大,即统计量χ2 不应该很大。如果χ2 值很大,即相对应的P 值很小,若 P≤α,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2 。 2.计算检验统计量 (2)当总例数 n≥40 且有一个格子1≤T5时:用校正公式;或改用四格表资料的Fisher确切概率法。 ?2分布是一连续型分布,而四格表资料属离散型分布,由此计算得的 ?2统计量的抽样分布亦呈离散性质。为改善?2统计量分布的连续性,则需行连续性校正(correction for continuity)。 ?2 连续性校正仅用于ν =1 的四格表资料,当ν≥2 时,一般不作校正。 (3)当n40,或T1时,不能用卡方检验,改用四格表资料的Fisher确切概率法。 3.作出统计结论 自由度ν愈大,χ2 值也会愈大;所以只有考虑了自由度ν的影响,χ2 值才能正确地反映实际频数A和理论频数T 的吻合程度。 检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,ν=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。 例8.5 某药品检验所随机抽取574名成年人,研究抗生素的耐药性(资料如表8-11)。问两种人群的耐药率是否一致? 表8-11 某抗生素的人群耐药情况 理论频数的计算 ?2检验的步骤 (1)建立假设并确定检验水准 H0:两种人群对该抗生素的耐药率相同,即?1 = ?2; (两总体率相等) H1:两种人群对该抗生素的耐药率不同,即?1≠?2 ;(两总体不相等) ?=0.05 (2)计算检验统计量 当总例数 n且所有格子的理论频数T5时:用检验的基本公式或四格表资料检验的专用公式: ?2= = 23.12 (3) 查?2界值表(附表7)确定P值, P>0.05,得出结论。按0.05水准,不拒绝H0,可以认为两组人群对该抗生素的耐药率的差异无统计学意义。 本例n40,因有一格子的理论数<5,因而要用校正?2 检验。 小结 T≥5,用四格表专用公式
您可能关注的文档
最近下载
- AP化学 2012年真题 (选择题+问答题) AP Chemistry 2012 Released Exam and Answers (MCQ+FRQ).pdf VIP
- 第六章 教会法.ppt
- 城镇供水厂运行维护及安全技术规程-详版.pptx
- 无铬厚膜底漆、厚膜预涂板和制备方法.pdf VIP
- 教师道德与法治新课标考试试题三套及答案.docx
- CMA考试 P2试题500道含解析.pdf VIP
- 新型锂电池电解液添加剂技改扩能项目环境影响报告书.pdf
- 2025年广东省中山市华辰实验中学九年级中考数学一模试题(原卷版+解析版).docx VIP
- 历史逻辑 理论逻辑 实践逻辑的必然结果.docx VIP
- 2024年05月江苏无锡市梁溪区机关事业单位招考聘用编外工作人员20人笔试历年高频考点(难、易错点)附带答案详解.docx VIP
文档评论(0)