分类资料的推断PPT
定性资料的统计推断;主要内容;6.1 率的区间估计;6.1 率的区间估计; 例1 在血吸虫病流行区中,某县根据随机原则抽查4000人, 其血吸虫感染率为15%,试区间估计该县血吸虫感染率的99%可信区间
总体率的99%可信区间
即 0.1354~0.1646
;6.1 率的区间估计3.精确概率法;上例中,95%可信区间为
即(0.0009,0.1776)
;4.利用二项分布的概率公式迭代;两率差的可信区间;6.2 样本率与总体率比较;6.2 样本率与总体率比较;;问题:;
例4 用一种新药治疗某种寄生虫病,受试者50人在服药后1人发生某种严重反应,这种反应在此病患者中也曾有发生,但过去普查结果约为每5000人中仅有1人出现。问此新药是否提高了这种反应的发生率?
;6.2 样本率与总体率比较方法二:正态近似法 (n较大);例5 根据以往经验,一般胃溃疡病患者有20%发生胃出血症状,现某医院观察65岁以上溃疡病人304例,有31.6%??生胃出血症状,问老年胃溃疡病患者是否较容易出血?
H0: π=0.2 H1: π0.2 α=0.05
p0.05 拒绝H0,认为……
; 6.3 两样本率的比较;6.3.1两样本率的U检验;例6
蛙 王 露:n=53,有效率81.13%
复方阿胶:n=56,有效率71.43%
二者是否有差别?
H0:π1 = π2;
H1:π1 ≠ π2;
α=0.05
n1=53,n1p1=43, n2=56,n2p2=40 pc=(43+40)/(53+56)=0.7615;;6.3.2 两样本率比较的卡方检验;χ2检验的原理;χ2检验的原理;Karl Pearson 1857~1936;;?2分布;;;理论数的计算;理论频数的计算;衡量理论数与实际数的差别;自由度为1 的?2分布;自由度为2 的?2分布;自由度为1的?2分布界值;?2检验的步骤;四格表?2检验的专用公式;四格表?2检验的专用公式;四格表?2的检验的应用条件:;;;;6.3.4 四格表的确切概率Fisher’s exact probability;确切概率的基本思想;四格表周边合计不变;四格表(周边合计不变时)所有可能的排列;每一种组合的概率;四格表所有可能排列的概率;四格表(周边合计不变时)所有可能的排列;P 值的计算;;两个率比较的u检验;;;;与正态分布的关系;6.4 配对资料的两率的比较 ;配对四格表资料的?2检验;;配对四格表资料的实际数与理论数;配对四格表资料的?2检验步骤;;精确概率法;上例中
p=p(0)+…+P(5)+P(26)+…+P(31)
=0.0001922;;理论数的计算;?2值的计算;?2值的计算;;多个率比较的?2检验的过程;自由度为2的?2分布界值;多重比较;6.6 构成比的比较;?2值的计算;?2值的计算;构成比比较的?2检验步骤;R×C表的分析方法的条件;定性资料假设检验的正确应用;;两标准化率的比较;甲、乙两医院乳腺癌手术后的标准化率;标准化率为:
甲 P1’=810/1138=71.18%
乙 P2’=648/1138=56.94%
H0:两标准化率相等 H1:两标准化率不相等;腋下淋巴结转移
(1);生存率之差的方差 ;6.8 高维列联表资料的统计分析 ;发育与副食品供应的关系;试在排除了年龄因素影响后,分析副食品供应对发育的影响情况。
分析:各年龄组发育差的比例是不等的,直接用简单合并栏的四格表资料计算不合理。也不可将每个年龄组的数据分别进行检验,然后将其结论综合,这样做往往会因为每个四格表的频数都很小,不宜得出显著性。
;要考虑发育与副食品供给之间的关系,需要对比数比(odds ratio,相对危险度的一种估计值)OR=1作假设检验,计算公共比数比及其可信区间。
公共OR:
;
;计算
χ2CMH的分子;OR的95%可信区间为;综合结果;本例中还可对各层的OR是否齐性作检验(Breslow-Day齐性检验)
χ2=1.534 df=3 p=0.675
说明不同月龄的婴儿,副食品的供应对其发育的影响是一致的。;6.9 趋势性χ2检验;例15 一项心肌梗塞发生前饮酒的病例-对照研究结果如下,试分析每日饮酒量与心肌梗塞发生之间是否存在剂量反应关系。 心肌梗塞患者及对照者的每日饮酒量;趋势性χ2检验的计算;; STATISTICS FOR TABLE OF I BY J
原创力文档

文档评论(0)