分类资料的推断PPT.ppt

分类资料的推断PPT

定性资料的统计推断;主要内容;6.1 率的区间估计;6.1 率的区间估计; 例1 在血吸虫病流行区中,某县根据随机原则抽查4000人, 其血吸虫感染率为15%,试区间估计该县血吸虫感染率的99%可信区间 总体率的99%可信区间 即 0.1354~0.1646 ;6.1 率的区间估计 3.精确概率法;上例中,95%可信区间为 即(0.0009,0.1776) ;4.利用二项分布的概率公式迭代;两率差的可信区间;6.2 样本率与总体率比较;6.2 样本率与总体率比较;;问题:; 例4 用一种新药治疗某种寄生虫病,受试者50人在服药后1人发生某种严重反应,这种反应在此病患者中也曾有发生,但过去普查结果约为每5000人中仅有1人出现。问此新药是否提高了这种反应的发生率? ; 6.2 样本率与总体率比较 方法二:正态近似法 (n较大) ;例5 根据以往经验,一般胃溃疡病患者有20%发生胃出血症状,现某医院观察65岁以上溃疡病人304例,有31.6%??生胃出血症状,问老年胃溃疡病患者是否较容易出血? H0: π=0.2 H1: π0.2 α=0.05 p0.05 拒绝H0,认为…… ; 6.3 两样本率的比较;6.3.1两样本率的U检验;例6 蛙 王 露:n=53,有效率81.13% 复方阿胶:n=56,有效率71.43% 二者是否有差别? H0:π1 = π2; H1:π1 ≠ π2; α=0.05 n1=53,n1p1=43, n2=56,n2p2=40 pc=(43+40)/(53+56)=0.7615;;6.3.2 两样本率比较的卡方检验;χ2检验的原理;χ2检验的原理;Karl Pearson 1857~1936;;?2分布;;;理论数的计算;理论频数的计算;衡量理论数与实际数的差别;自由度为1 的?2分布;自由度为2 的?2分布;自由度为1的?2分布界值;?2检验的步骤;四格表?2检验的专用公式;四格表?2检验的专用公式;四格表?2的检验的应用条件:;;;;6.3.4 四格表的确切概率 Fisher’s exact probability;确切概率的基本思想;四格表周边合计不变;四格表(周边合计不变时)所有可能的排列;每一种组合的概率;四格表所有可能排列的概率;四格表(周边合计不变时)所有可能的排列;P 值的计算;;两个率比较的u检验;;;;与正态分布的关系;6.4 配对资料的两率的比较 ;配对四格表资料的?2检验;;配对四格表资料的实际数与理论数;配对四格表资料的?2检验步骤;;精确概率法;上例中 p=p(0)+…+P(5)+P(26)+…+P(31) =0.0001922;;理论数的计算;?2值的计算;?2值的计算;;多个率比较的?2检验的过程;自由度为2的?2分布界值;多重比较;6.6 构成比的比较;?2值的计算;?2值的计算;构成比比较的?2检验步骤;R×C表的分析方法的条件;定性资料假设检验的正确应用;;两标准化率的比较;甲、乙两医院乳腺癌手术后的标准化率;标准化率为: 甲 P1’=810/1138=71.18% 乙 P2’=648/1138=56.94% H0:两标准化率相等 H1:两标准化率不相等;腋下淋巴结转移 (1);生存率之差的方差 ;6.8 高维列联表资料的统计分析 ;发育与副食品供应的关系;试在排除了年龄因素影响后,分析副食品供应对发育的影响情况。 分析:各年龄组发育差的比例是不等的,直接用简单合并栏的四格表资料计算不合理。也不可将每个年龄组的数据分别进行检验,然后将其结论综合,这样做往往会因为每个四格表的频数都很小,不宜得出显著性。 ;要考虑发育与副食品供给之间的关系,需要对比数比(odds ratio,相对危险度的一种估计值)OR=1作假设检验,计算公共比数比及其可信区间。 公共OR: ; ;计算 χ2CMH的分子;OR的95%可信区间为;综合结果;本例中还可对各层的OR是否齐性作检验(Breslow-Day齐性检验) χ2=1.534 df=3 p=0.675 说明不同月龄的婴儿,副食品的供应对其发育的影响是一致的。;6.9 趋势性χ2检验;例15 一项心肌梗塞发生前饮酒的病例-对照研究结果如下,试分析每日饮酒量与心肌梗塞发生之间是否存在剂量反应关系。 心肌梗塞患者及对照者的每日饮酒量;趋势性χ2检验的计算;; STATISTICS FOR TABLE OF I BY J

文档评论(0)

1亿VIP精品文档

相关文档