分类变量数据的统计分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分类变量数据的统计分析

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 卫生学(第7版) · 第十章 分类变量资料的统计分析 * 例10-13 某研究者欲了解白内障发病是否与ABO血型有关,收集有关资料见表10-11,问白内障组与对照组ABO血型分布有无差别? 卫生学(第7版) · 第十章 分类变量资料的统计分析 * H0 :白内障组与对照组ABO血型分布相同 H1 :白内障组与对照组ABO血型分布不同或不全相同 ?=0.05 查表得,?20.05(3)=7.81, ?2?20.05(3),P0.05, 按?=0.05的检验水准,不拒绝检验假设,尚不能认为白内障组与对照组ABO血型分布不同。 (1) (2) (3) ? =(2-1)(4-1)=3 卫生学(第7版) · 第十章 分类变量资料的统计分析 * 理论数不宜太小。(不能有1/5以上格子的理论频数小于5或者有一个格子的理论频数小于1)。处理方法 如假设检验的结果是拒绝无效假设,只能认为各总体率或构成比之间总的来说有差别。若要进一步了解哪两者之间有差别,可用卡方分割法,或者调整检验水准。 对于单向有序行列表,在比较各处理组的效应有无差别时,应该用秩与检验。 行×列表卡方检验的注意事项: 卫生学(第7版) · 第十章 分类变量资料的统计分析 * 如:用某药治疗某病患者,5例中有3例治愈,计算治愈率为3/5×100%=60.0%,如果有4例治愈,则其治愈率为80%。显然,这个结果是不稳定的。 在分母例数很少的情况下,个别的偶然因素会导致结果的变化,只有分母例数较大时,计算的相对数才比较稳定。在例数较少时,通常直接用绝对数表示。如果要用相对数表示,则需列出其总体率的置信区间。 卫生学(第7版) · 第十章 分类变量资料的统计分析 * 某产院拟分析当地畸形儿与母亲分娩年龄的关系,检查了新生儿4470例,得以下资料,据此得出结论:“母亲年龄在24—29岁时,畸形儿最多,占总数的92.2%,表明该年龄段易发生畸形儿,符合一般规律”。试分析该结论是否合理? 某地畸形儿与母亲分娩年龄的关系 卫生学(第7版) · 第十章 分类变量资料的统计分析 * 学 生 检查人数 阳性人数 检出率(%) 阳性构成比(%) 小学生 660 6 0.91 5.41 初中生 1115 49 4.39 44.14 高中生 1563 56 3.58 50.45 合 计 3338 111 3.33 100.00 表10-1 2001年某地中小学学生HBsAg检出率及构成比 卫生学(第7版) · 第十章 分类变量资料的统计分析 * 在进行率或构成比比较时,除了要比较的因素外,其他影响的因素应基本一致。 例如,分析比较两医院病死率的时,应注意两个医院的条件应基本相同,如果上级医院的病死率高于基层医院的病死率,并不能说明上级医院医疗水平不如基层医院,这是因为许多疑难病人均由基层医院转入上级医院所致。 卫生学(第7版) · 第十章 分类变量资料的统计分析 * 当比较两个总率时,若其内部构成不同,需要进行率的标准化。 卫生学(第7版) · 第十章 分类变量资料的统计分析 * 理论频数太小的3种处理方法 增大样本含量,以达到增大理论频数的目的; 删去理论频数太小的格子对应的行或列; 合理合并:结合专业,将理论频数太小的行或列与性质相近的行或列合并。 (黄陈平 施红英) * * * * * * * * * * * * * * * * * * * * * * * 卫生学(第7版) · 第十章 分类变量资料的统计分析 * 总体率的区间估计 总体率的估计: 点估计 区间估计 正态近似法 查表法 卫生学(第7版) · 第十章 分类变量资料的统计分析 * 正态近似法 当样本含量n足够大,样本率p或1-p均不太小时(如np与n(1-p)均大于5),样本率的分布近似正态分布。 u?是标准正态分布双侧临界值,在估计总体率的95%置信区间时,其值为1.96;99%置信区间时,其值为2.58。 卫生学(第7版) · 第十章 分类变量资料的统计分析 * 95%的置信区间: 38.47%?1.96?1.16%=36.20%~40.74% 99%的置信区间: 38.47%?2.58?1.16%=35.48%~41.46% 例10-6中该地人群中结核菌素试验阳性率95%与99%的置信区间为: 卫生学(第7版) · 第十章 分类变量资料的统计分析 * 查表法 当n较小,如n?50,特别是p接近于0或1时,按二项分布原理估计总体率的可信区间。 因其计算比较复杂,统计学家已经编制了总体率可信区间估计用表,可根据样本含量n与阳性数x

文档评论(0)

jgx3536 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档