- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学讲座 样本含量的估算 Thank You for Listening! (1)均数估计的样本含量: 2、样本含量估计公式 (2)率估计的样本含量: 当P在0.2~0.8时 当P小于0.2或大于0.8时 (10) (12) 【例7】从某中学5400名学生中抽取270人作为样本进行近视眼情况预调查。结果为:平均视力为0.8,标准差为0.54。患近视眼的学生共为123人。试估计该中学学生的平均视力及患近视眼学生的比例。 【分析】全校学生作为总体。若要求相对误差为ε=10%。置信水平为1-α=95%。 【例7】计算过程(1) (1)总体均数估计的样本含量: 本例:至少调查175例。预调查270例,样本含量足够。 (2)总体率的样本含量估计 P=123/270=0.4556 【例7】计算过程(2) 本例:需要调查459例。预调查只抽取了270人。 此调查的最小样本含量应取两者最大者:即为459例。 正式调查可考虑调查459例学生。 其抽样误差小于单纯随机抽样。由于系统抽样无专用的标准误计算公式,往往按单纯随机抽样的办法来估计总体参数和样本含量。 (二)系统随机抽样 【例8】以例6为例。设初中段学生有2900名,高中段学生有2500名。按每层1/20的比例抽样,则得到初中段学生145名,高中段学生125名。其平均视力依次为0.8和 0.7。标准差依次为0.58和0.45。近视眼率分别为P1=0.4,P2=0.55。 (三)分层随机抽样 1、样本含量估计 (1)按总体均数估计: 总均数为: 总的方差为: 【例8】 计算过程 变异系数为: 样本含量为: 按比例分到两个年龄段 : , (2)按总体率估计: (2)按总体率估计: 按比例分配,两个年龄段抽取的人数为: 初中生: 高中生: 【例9】调查某社区65岁以上老人总数X。其中,需上门卫生服务的总数Y和两者之比Y/X,拟随机抽取若干居民组后进行整群调查。要求相对误差不走过20%,置信程度达到95%。 (四)一阶段整群抽样 由小规模预调查得知: 试估计需要多少居民组? (1)估计65岁以上老人总数的最小样本含量约为: 【例9】计算过程(1) (2)估计需上门卫生服务的65岁以上老人总数,最小样本含量约为: (3)估计需上门卫生服务的65岁以上老人总数与65岁以上老人总数之比值,最小样本含量约为 【例9】计算过程(2) 此项研究中计算了三个样本含量,为能达到所有研究目的,最小样本含量应为三者中最大者,即为49例。 四、流行病学调查研究中样本含量的估计 (一)队列研究中样本含量估计 1、定义(cohort study)是一种常用于确证病因的观察性研究方法。 基本的研究过程是将研究人群按是否暴露于某个待研究的因素或暴露水平,而将研究对象分成不同的组。如暴露组和非暴露组,随访观察一定时间并追踪各组观察对象的发病或死亡的结局,比较各组间结局的差异,以驻暴露因素与疾病之间有无因果关联及关联大小。 已知:非暴露组人群和暴露组人群某病发生率π1和π2,相对误差ε和检验水准α。则样本含量估计公式为: 2、总体相对危险度的估计 【注意】 (1)此公式:在流行病学书上没有。为卫生统计学独家拥有。 (2)π1和π2也可写为非暴露组P0和暴露组P1。 【例10】在一个队列研究中,相对危险度RR的真值为1.85,非暴露人群的患病率(π1)为0.2,置信区间为95%。估计的相对误差(ε)在真值的10%的范围内。问需要多大样本含量? 【例10】计算过程(1) 1.计算:暴露人群的患病率:π2=×π1=1.85×0.2=0.37 结果:暴露组与非暴露组各需要1973例观察对象。 若对RR进行假设检验时,样本含量的公式为 2、相对危险度的假设检验 式中: πc:为合并率。 【例11】在临床队列研究中,将人群分为具有某种白细胞抗原(非暴露组)和不具有该抗原的组(暴露组)。经5年观察,记录每组中患某种疾病的人数。据有关资料, 值为0.5。不具有该抗原的组(暴露组)患病率(π1)为0.3。取α=0.05,β=0.1,1-β=0.9。问对RR值作出检验需要多大的样本含量? 【例11】计算过程(1) 计算: 将指标代入公式有 【例11】计算过程(2) 结果:两组各需要人群约161例。 【注意】 (1)暴露队列与非暴露队列的比例:取决于自然人群中暴露的频率。若暴露人群因素非常罕见,则不适宜做队列研究。 (2)队列研究的随访时间:当样本含量较少,时间相应要长,而样本含量较大时,时间可以缩短。随访时间过,可致失访率增高。 【注意】 1、定义:先确定病例组与对照组。再调查两组人群过去暴露于各种可能危险因素的情形。经统计学分析来判断疾病是否与暴露的危险因素有关联及其关联的程度。
文档评论(0)