06-分类变量的统计推断课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
预防医学 分类变量的统计推断 提纲 样本率的抽样分布 总体率的估计 关于总体率的假设检验 一、样本率的抽样分布 在上个章节中我们讨论了从正态分布总体中作随机抽样,由于存在个体变异,产生抽样误差 显然,由于个体差异和偶然性的影响,样本率通常也和总体率情况不同 由抽样造成样本率之间以及样本率与总体率的差异称为率的抽样误差 样本率的抽样分布 随机抽样试验,分别在总体率?=0.4、n=20; ?=0.4、n=100、?=0.01、n=100以及?=0.5 、 n=10的总体中随机抽样 每种情况分别随机抽10000个样本,每个样本计算其样本率,把同一种情况的10000个样本率视为一个新的样本资料作频数图 样本率的抽样分布 总体率?相同时,样本含量越大,样本率的分布越趋向对称 样本含量n相同时,?越偏离0.5,样本率的分布越偏态分布 总体率?=0.5时,很小样本含量的样本率都呈对称分布 样本率的平均值等于总体率,样本率p的样本标准差 样本率的抽样分布 样本率的总体均数等于总体率 样本率的标准差(即率的标准误) 由于总体率通常是未知的,因而用样本率p来估计p,故率的标准误的估计值常表示为 样本率的抽样分布的正态近似 对于大量重复随机抽样而言,样本率p围绕着总体率波动,样本含量n越大,这种波动越小 当n的值充分大时,p的分布就近似于均数为p,标准差为 sp 的正态分布。这里样本含量n “充分大”指 np与n(1-p)均大于5 当总体率?=0.5时,则样本率p的分布为对称分布 当样本含量n为定值时,总体率?越接近0.5,样本率p近似正态分布的程度就越好 二、总体率的可信区间 与总体均数的可信区间相同,率的可信区间的含义同样也是:按照一定的可信度(95%或99%)确定的包含未知总体率的可能范围 不过由于样本中阳性数的取值满足的是二项分布,所以计算样本所来源的总体率也必须从二项分布入手,直接计算过程繁琐 总体率的可信区间的正态近似法 当np与n(1-p)均大于5且n足够大(n50)时,样本率p的抽样分布近似正态,可以写为p ~ N( p, sp2) 此时,计算p的95%CI的方法就和前面介绍的标准正态分布法求总体均数的可信区间相似 总体率的1-a可信区间为 用ELISA法检测某地105名7岁男生的乙肝表抗,共有67例阳性,检出率为63.8%,试估计检出率的95%可信区间? 解: 三、关于总体率的假设检验 医学研究中经常涉及样本率与总体率的比较、两个或多个样本率的比较等问题 类似于定量变量的假设检验(t检验),对于分类变量也可以用假设检验的思想分析上述问题 1、样本率与总体率的比较:Z检验 例9-3:据大量观察,旧药物治疗某病的治愈率为70%,今随机抽取该病患者200人,改用新药治疗治愈160人,试问两种药物的疗效是否不同? 样本率与总体率的比较 当前的样本率为80%,和旧药物的不一样,那么究竟是由于抽样所导致还是两种药物疗效的确有别? 假设两种药物的疗效相同,那么在总体治愈率为70%的情况下,200例患者中出现治愈人数n≥160例以及n≤120的可能性只和是否是小概率事件?(思考为何如此表达?) 如果不是小概率事件,我们还不能认为两种药物疗效有别;而如果是小概率事件,那么新旧药物的疗效看来是不同的 样本率与总体率比较 样本率与总体率比较 2、两个大样本率比较:Z检验 例9-4:某地随机抽查206名成年男性与201名成年女性的乙肝表抗携带情况,其中男性阳性33人,女性阳性22人,问男女的阳性情况是否不同? 两个大样本率比较 例题中可见两个样本率不相同,不同性别的阳性率的差别是由于抽样所导致还是本质的差别? 与前面的两个样本均数比较的t检验类似,下面采用类似的方法分析两个样本率的问题 两个大样本率比较Z检验原理 两个大样本率比较Z检验原理 两个大样本率比较Z检验原理 两个大样本率比较Z检验 3、卡方检验 χ2检验chi-square test是现代统计学的创始人之一,英国人Karl . Pearson于1900年提出的一种具有广泛用途的统计方法 可用于两个或多个率间的比较,分类资料的关联度分析,拟合优度检验等等 Karl. Pearson Carl Pearson or Karl Pearson (1857-1936) Journal Biometrika Pearson product-moment correlation coefficient、Linear regression and correlation、Pearsons chi-square test 卡方检验的基本思想 例9-5:某中药在改变剂型前治疗152例,治愈129例;改变剂型后又观察130例,治愈101例,改变剂型前后的疗效是否不同?

文档评论(0)

mkt361 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档