[医学]医学统计学定性资料的统计分析-χ2检验.pptVIP

[医学]医学统计学定性资料的统计分析-χ2检验.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[医学]医学统计学定性资料的统计分析-χ2检验

第六节 定性资料的统计分析 一、两个率比较的Z检验 当样本含量n足够大,样本率p或1-p均不太小时(如np和n(1-p)均大于5),样本率的分布近似正态分布。样本率和总体率之间、两个样本率之间的比较可用Z 检验(Z test) 。 (一)样本率与总体率的比较 样本率与总体率比较的目的是推断该样本是否来自某已知总体。统计量Z 的计算为: 例4-6-1 据临床研究,一般的胃溃疡病患者有25%会出现胃出血症状。某医院观察了300例65岁的胃溃疡病患者,其中有99例发生胃出血,占33.0%,问老年患者是否较一般患者易出血? 本例,样本率为25%,np和n(1-p)均大于5,可采用Z 检验。 检验假设: H0:?=?0, 老年胃溃疡病患者的胃出血率等于25%; H1:??0, 老年胃溃疡病患者的胃出血率大于25%。 单侧?=0.05。 计算统计量Z : 确定P 值和判断结果: Z0.01=2.326,得P0.01,按?=0.05水准拒绝H0,接受H1。 认为老年胃溃疡病患者的胃出血率大于20%,即老年患者较一般患者易出血. (二)两样本率的比较 两个样本率比较的目的是推断两总体率是否相等。检验方法可用Z 检验和后面介绍的?2检验。Z 检验公式为: 例4-6-2 某肿瘤医院4年来共治疗食道癌患者131例,每例均观察满5年,其中单纯手术治疗组观察84例,存活57例,存活率p1=67.9%,联合治疗(手术+术后化疗)组观察47例,存活39例,存活p2=83.0%,问两组存活率有无差别? 两样本率比较的检验假设为: H0:两总体存活率相等,即?1=?2; H1:两总体存活率不等,即?1??2。 ? = 0.05。 用正态近似检验,检验统计量Z为: 注意:这里所介绍的两样本率比较的Z 检验,当n1p1、n2p2、n1 (1?p1)、n2 (1-p2)均大于5才适用,如果n 较小,则可以用校正的Z 检验公式: 而当n 很小时(比如n≤40时),须用确切概率法(见?2检验部分内容)。 二、?2检验(Chi-square test) 主要应用: 推断两个或多个样本率之间有无差别; 推断两个或多个构成比之间有无差别; 检验分类变量配对设计下的卡方检验; 频数分布的拟合优度检验等。 (一) χ2分布 χ2分布是一种连续型随机变量的概率分布 (二)?2检验的基本思想 例4-6-1 据临床研究,一般的胃溃疡病患者有25%会出现胃出血症状。某医院观察了300例65岁的胃溃疡病患者,其中有99例发生胃出血,占33.0%,问老年患者是否较一般患者易出血? 假设检验的基本步骤: 1.建立假设 H0:无效假设,两总体存活率相等,即?1=?2 H1:备择假设,两总体存活率不等,即?1??2 2.确定检验水准:α= 0.05。 3. 选择检验方法,并计算检验统计量 4. 确定P值,作出推断结论 P≤α,拒绝H0,接受H1 P>α,不拒绝H0 ?2检验的基本公式: ?2 =∑(A-T)2/T 式中:A代表每个格子的实际频数( actual frequency ),即表中的基本数据;T代表每个格子的理论频数( theoretical frequency )。 从公式中可以看出: ?2值反映的是实际频数与理论频数的吻合程度。 如果实际频数与理论频数的差别是由抽样误差造成的,即H0假设成立,则实际频数与理论频数应该比较接近, 其?2值 也就应该比较小;反之,如果?2值较大,则说明实际频数与理论频数相差较大,超出了抽样误差所能解释的范围,就认为H0假设不成立,即两样本对应的总体率不等, ?2 值越大,就越有理由认为H0假设不成立。 由公式 还可看出,?2值的大小除取决于|A-T|的差值外,还与基本数据的格子数有关(因为每格的 都≥0 ,且一般都>0,故?2值一般随着格子数的增多而加大),严格地说是与自由度有关。四格表及行×列表的自由度,是指在表中周边合计数不变的前提下,基本数据可以自由变动的格子数。如四格表中基本数据有四个,其中任一数据发生变化,其余三个数据由于受周边合计数的限制,只能随之相应变动,故其自由度为1;若基本数据大于4个,则自由度也必然大于1。行×列表的自由度? 为: ? =(行数一1)(列数一1) 四格表是由2行2列组成的,故? =1。 基本步骤: 1.建立假设:H0:?1=?2 ;H1:?1??2 ,α= 0.05。 2.计算理论值和?2统计量: 四格表资料专用公式 由于理论频数均是从四格表中实际频数计算出来的,故?2

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档