- 1、本文档共34页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分类变量资料的统计推断
* 分类变量资料的 统计推断 广州医学院预防医学系 一、率的抽样误差和总体率的估计 1. 率的抽样误差与标准误 (sampling error standard error of rate ) 率的抽样误差:由抽样造成的样本率与总体率的差别,或样本率之间的差别。 率的标准误:表示率的抽样误差大小的统计指标。 ( Sp 为?p的估计值, p为 ?的估计值 ) *公式计算 : ? ( 1 - ? ) p ( 1 - p ) ?p = ? ; Sp = ? n n 正态近似法: 当n足够大,若 n p 5 和n (1-p) 5,则总体率 (1- ?) 可信区间为: 总体率95%可信区间为 p ? 1.96 sp 总体率99%可信区间为 p ? 2.58 sp p ? u? sp = p - u? sp ~ p + u? sp 2. 总体率的区间估计 例: 某地中学生就餐方式与乙肝病毒感染情况调查 就餐方式 调查人数 感染人数 感染率(%) 常在外就餐(A) 89 6 6.74 不在外就餐(B) 111 5 4.50 合计 200 11 5.50 √ p(1- p) Sp = n 抽样误差: =0.0266 = 2.66% 0.0674(1 - 0.0674 ) Sp = 89 √ (A): (B): 0.0450 (1 - 0.0450 ) Sp = 111 √ =0.0197 = 1.97% 例: 某地中学生就餐方式与乙肝病毒感染情况调查 就餐方式 调查人数 感染人数 感染率(%) 标准误 常在外就餐(A) 89 6 6.74 2.66% 不在外就餐(B) 111 5 4.50 1.97% 总体率95%可信区间为 p ? 1.96 sp 总体率99%可信区间为 p ? 2.58 sp 总体感染率95%可信区间: (A): 6.74% ?1.96×2.66% = 1.53% ~ 11.95% (B): 4.50% ?1.96×1.97% = 0.64% ~ 8.36% 二、率的u检验 1. 样本率与总体率比较 目的:推断样本率所代表的总体率 ? 与某总体率 ?0 是否相等。 | p-?0 | u = ? p ? | p - ?0 | u = ?0 (1- ?0) /n 条件:np 5 和 n (1 - p ) 5 公式: 例:某地城镇25岁以上居民高血压患病率为 11%,随机抽查该地矿区25岁以上居民598 人,确诊高血压者有82人。矿区居民与城镇 居民高血压患病率有何不同? 城镇居民高血压患病率:?0 =11%= 0.11 矿区居民高血压患病率:p = 82/598 = 0.14 ? 分析目的: 推断 ? 与 ?0 是否不同? 假设:H0: ? = ?
文档评论(0)