- 1、本文档共121页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十一章_卡方检验
实例1 已知北方农村儿童前囟门闭合月龄为14.1月。某研究者从东北某县抽取36名儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月龄的均数是否与一般儿童不同?;实例2:某军区总医院欲研究A、B、C三种降血脂药物对家兔血清肾素血管紧张素转化酶(ACE)的影响,将26只家兔随机分为四组,均喂以高脂饮食,其中三个试验组,分别给予不同的降血脂药物,对照组不给药。一定时间后测定家兔血清ACE浓度(u/ml),如表1,问四组家兔血清ACE浓度是否相同?;问题1: 研究目的是什么?;例11.1 某研究者欲比较甲、乙两药治疗小儿上消化道出血的效果,将90名患儿随机分为两组,一组采用甲药治疗,另一组采用乙药治疗,一个疗程后观察结果,见表11.1。问两药治疗小儿上消化道出血的有效率是否有
差别?;表11.1 甲、乙两药治疗小儿上消化道出血的效果 ;第十一章 检 验;卡方检验是英国统计学家K. Pearson于1900年提出的,以卡方分布和拟合优度为理论依据,一种用途较广的假设检验方法。
;完全随机设计下两个或多个样本率(或构成比)
配对设计下两组频数分布
线性趋势卡方检验
推断两变量间有无相关关系等。;第一节 独立样本列联表资料的卡方 检验
第二节 配对设计资料的卡方检验
第三节 拟合优度的卡方检验
第四节 线性趋势卡方检验
第五节 四个表的确切概率法; 第一节 完全随机设计(独立样本)列联表资
料的 检验
在抽样研究中,由于个体间存在变异,必然存在着抽
样误差,率(或构成比)的抽样误差与均数的抽样误差
概念相同。
;例11.1 某研究者欲比较甲、乙两药治疗小儿上消化道出血的效果,将90名患儿随机分为两组,一组采用甲药治疗,另一组采用乙药治疗,一个疗程后观察结果,见表11.1。问两药治疗小儿上消化道出血的有效率是否有
差别?;表11.1 甲、乙两药治疗小儿上消化道出血的效果
;表11.1 甲、乙两药治疗小儿上消化道出血的效果
两组的有效率不同有两种可能:
1. 两药的总体有效率无差别,两样本率的差别仅由抽
样误差所致。
2. 两种药物的有效率确有不同。
;(1)建立检验假设
H0:π1= π2 两药的有效概率相同
H1: π1≠π2 两药有效概率不同
检验水准?=0.05
(2)计算检验统计量;一、卡方检验的基本思想
表11.1中,27、18、40、5 是整个表的基本数据,是实际观察得到的,其余数据都是从这四个基本数据相加而得的,这种资料是两组两分类资料,称为四格表(fourfold table),亦称2×2表(2×2 table)。 (画黑板)
;表 两独立样本率比较的四格表
;无效假设H0为π1=π2,即两种药物治疗小儿消化道出血的有效率相同,两样本的有效率的差别仅有抽样误差所致。由于此时总体情况未知,故用样本合计有效率对总体有效率进行估计,即H0为π1=π2=74.44%,在此基础上,可以推算每个格子的期望频数,称为理论频数,用符号T表示;从样本观察到的频数称为实际频数,用符号A表示。
;若H0成立,则理论上:
甲药组有效人数为:
甲药组无效人数为:
乙药组有效人数为:
乙药组无效人数为:;
为相应行的合计
为相应列的合计
n 为总例数。 ;表11.1 甲、乙两药治疗小儿上消化道出血的效果 ; 检验的基本公式:
从基本公式可以看出, 统计量值反映了实际频数和理论频数的吻合程度。;由 统计量的公式(11.2)可以看出, ,格子数越多,非负数之和,则卡方值越大,即卡方值的大小除了与A与T的差别大小有关外,还与格子数量有关。因而考虑卡方值大小的同时,应同时考虑格子数的多少。引入自由度v。
式中,k为格子数,s为估计的参数个数,R为行数,C为列数。
如本例中,4个格子,估计甲乙两药的有效率,则k=4,s=2,v=4-1-2=(2-1)(2-1)=1。; 检验的基本公式:
一定自由度下,如果假设检验H0 (π1=π2)成立,则实际频数和理论频数之差一 般不会相差太大, 值相应也不会太大; 反之,实际频数和理论频数之差相差很大,则 值相应也会很大,大到什么程度认为不是抽样误差造成的而是两个不同总体呢?;
分布是一种连续型随机变量的概率分布。
设有v 个相互独立的标准正态分布随机变量Z1, Z2, ??? Zv, 的分布称为自由度为v的 分布,记为 。
分布的形状依赖于自由度v
文档评论(0)