- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计数资料的统计推断 第八讲 计数资料统计推断内容 率差或率比的区间估计:u分布,二项分布 假设检验:u检验,?2检验 一、计数资料假设检验- 二项分布直接法及u检验- P 0.001,按?=0.05,拒绝H0,接受H1,可认为老年患者胃出血率与一般患者不同,老年溃疡病患者更容易出现胃出血。 老年溃疡病患者出血率的95%可信区间:0.262 ? 0.378 一般出血率:0.20 H0:?1=?2, 两者高血压患病率相同 H1:?1??2 ,两者高血压患病率不同 ?=0.05 二、计数资料的假设检验---- 卡方检验----Pearson Chi-square test Karl·Pearson,1857~1936,生卒于伦敦,公认为统计学之父。 1879年毕业于剑桥大学数学系;曾参与激进的政治活动,还出版几本文学作品,并且作了三年的实习律师。1884年进入伦敦大学学院 ,教授数学与力学,从此在该校工作一直到1933年。 K· Pearson 最重要的学术成就,是为现代统计学打下了坚实基础。K·Pearson 在1893-1912年间写出18篇《在进化论上的数学贡献》的文章,而这门“算术”,也就是今日的统计。许多统计名词如标准差,成分分析,卡方检验(1900)都是他提出。 ?2检验的主要应用 推断两个/两个以上总体率或构成比有无差别; 两分类变量间有无相关的假设检验(独立性); 拟合优度检验(理论分布与实际分布的吻合情况检验)。 (一) ?2 检验主要类型 四格表资料的?2检验 2?2列联表的?2检验 R?C表资料的?2检验 卡方检验基本思想:以四格表资料为例 例4、在二乙基亚硝胺诱发大白鼠鼻咽癌的实验中,一组单纯用亚硝胺向鼻腔灌注,另一组在鼻注的基础上加肌注维生素B12,问两组发癌率有无差别? 表1 两组大白鼠发癌率的比较 1、建立假设 H0:两组发癌率相等,?1=?2=? H1:两组发癌率不等, ?1??2 ?=0.05 为反映所有格子的吻合情况,所有差值求和,?(A-T)=0 (正负抵消),差值和可定义为?(A -T)2 ; 相对比例保持不变,T值越大, ?(A-T)2值越大,为消除其影响,差值定义为: ?(A-T)2/T 2、计算统计量?2 在样本量足够大时,该值服从于自由度为?=(行数-1)(列数-1) 的?2 分布。 即?2检验公式: ?2 = ?(A-T)2/T ?2分布是一簇连续性分布,与自由度有关;在自由度固定时, ?2值越大,P值越小,反之亦然. 在无效假设成立时: ?2值一般不会很大,出现大的?2值的概率P是很小的,若P?( 检验水准),则怀疑假设成立,因而拒绝它; 若P?( 检验水准),则没有理由拒绝它。 3、 P值与?2分布 ?2值反映了实际频数与理论频数的差值大小 ?2值大小与p值呈反比关系,即?2 值越大,P值越小;反之亦然。 ?2值达到界值点,就有理由认为成立的可能性不大,是小概率事件,因而拒绝H0 。对于四格表资料:?0.052=3.84 四格表资料?2 检验计算结果 本例?2 值=6.48,自由度为1,查?2 界值表,得p0.05, 按照?=0.05的水准,拒绝H0,而接受H1,可认为两组总体发癌率不同 四格表资料的应用条件 当T?5,而n40时, 选用一般计算公式 当1T5,而n40时, 需计算校正公式 当T1或n40时,选用Fisher确切概率法1934 3、率差的区间估计 u检验也能回答两个率是否有差别(或差别有无统计学意义)? 两率比较的可信区间估计(miettinen,woolf) 可信区间为 ,两组率差值(0.196)的95%可信区间为0.07-0.33。 应用条件:两组n?p和n?(1-p)5 4、率比(RR和OR)区间估计 本资料为临床试验研究,可以同时计算RR与OR值,用以分析Vitb12对发癌危险度的大小,OR1表示Vitb12为危险因素。 以OR值为例,OR服从对数正态分布,则有: 实例分析 (二)、2X2列联表(配对设计) 1、资料特点与分析目的 资料的特点:配对计数资料 分析目的: A:两法检验结果有无关系(四格表?2检验) B:两法检验有无差别(专用公式)。 2、假设检验(1):相关分析 检验目的:两法检验结果有无关系。 H0:两法检验结果无关系 H1:两法检验结果有关系 ?=0.05 ?2值=38.85,?=1 确定P值: 查卡方界值表,得P0.005, 按照?=0.05的水准,拒绝H0,而接受H1,可认为两法检验结果有关。 计算Pearson列联系数反映相关程度[sqr
文档评论(0)