分类资料的推断与x2检验-统计学PPT课件.ppt

分类资料的推断与x2检验-统计学PPT课件.ppt

C班理论课:4.5(周一)上午3-4节 改为:4.2(周五)上午3-5节 501课室 B班理论课:4.5日(周一)上午8-10节 改为:4.8(周四)上午 3-5节 201课室;第十章 分类变量资料的统计分析;第二节 分类变量资料统计推断;一、率的抽样分布;;贝努利试验(Bernoulli trials ):;二项分布 (binomial distribution):; 已知: ① π =0.3,n =5 ; ② π =0.3,n =10 ; ③ π =0.3,n =15 ; ④ π =0.5,n =10 。 试根据式(10-6)求各阳性数事件的概率并作概率分布图。;图10-1 率的抽样分布图 (二项分布);率的抽样分布特征:; 1. 抽样误差的概念: 在抽样研究中,率和均数一样,也存在抽样误差,即样本率和总体率或各样本率之间存在着差异,这种差异称为率的抽样误差(sampling error of rate)。 ;2. 率的标准误: ;例10-6 为了解某地人群结核菌素试验阳性率情况,某医疗机构在该地人群中随机检测了1773人,结核菌素试验阳性有682人,阳性率为38.47%,试计算其标准误。;三、总体率的估计 ; (一)正态近似法: 当样本含量n足够大(例如大于50),样本率P或1-P均不太小时(如nP和n(1-P)均大于5),样本率的分布近似正态分布,可按正态分布的理论来估计总体率的可信区间。 ;正态近似法举例(基于例10-6);四、样本率比较的u 检验 :;(一) 样本率与总体率的比较: ;例10-7 一般情况下,直肠癌围术期并发症发生率为30%,现某医院手术治疗了385例直肠癌患者,围术期出现并发症有100例,并发症发生率为26%,问该院直肠癌患者围术期并发症发生率与一般情况比较有无统计学差异。;首先讨论应用条件:是否满足下式。 本例: ;1. 建立检验假设: H0: ? =?0 H1: ? ??0 ? =0.05 2.计算u 值: ; 3. 确定P 值,判断结果 本题u=1.713<1.96,P>0.05,按?=0.05的水准不拒绝H0,差异无统计学意义,故尚不能认为该院直肠癌患者围术期并发症发生率与一般情况不同。;(二)两个样本率的比较:;例10-8 为了解某地小学生蛔虫感染率的城乡差异,抽样调查了该地小学生22792人,其中城镇小学生8207人??粪检蛔虫卵阳性数为701人,蛔虫感染率为8.54%,乡村小学生14585人,粪检蛔虫卵阳性数为2167人,蛔虫感染率为14.86%,试比较该地小学生蛔虫感染率城乡差异有无统计学意义。;首先讨论应用条件。 1. 建立检验假设: H0: ?1=?2 H1: ?1??2 ? =0.05 ;2.计算u 值:; 3. 确定P 值和判断结果: 本题u =13.7392.58,P0.01,按?=0.05的水准,拒绝H0,差异具有统计学意义,该地城镇和乡村小学生蛔虫感染率不相等,乡村小学生蛔虫感染率高于城镇小学生。 ;一、 ?2 检验的基本思想 二、四格表资料的?2 检验 三、配对设计分类变量资料 的? 2检验 四、行×列表资料的? 2检验; 方法简介: 检验(chi-square test或称卡方检验)是英国统计学家Pearson在1900年提出的一种用途广泛的假设检验方法。 这里介绍其用于两个或两个以上独立样本的率(或构成比)的比较以及配对资料比较的方法。 ;一、 检验的基本思想: ; 四个格子的数据是表10-7中基本数据,其余的数据都是从这四个数据推算得来的,这种资料称四格表(fourfold table)资料。 ; A为实际频数(actual frequency), 即每个格子的实际发生数,T为理论数(theoretical frequency),是根据无效假设推算出来的。 H0:?1=?2 =p0 = 80.53%(91/113) ; A药治疗71人,理论上应该有: 71?(91/113)=57.18人有效; B药治疗42人,理论上应该有: 42?(91/113)=33.82人有效。 理论频数可由下式求得:

文档评论(0)

1亿VIP精品文档

相关文档