- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
负二项分布抽样中的患病率无偏估计.doc
负二项分布抽样中的患病率无偏估计
李宝月/金欢/罗剑锋/姜庆五/赵耐青
【内容提要】
目的 本次研究以第三次全国血吸虫病流行病学调查为背景,对其部分抽样过程进行计算机模拟,采用负二项分布抽样方法,得到感染率的无偏估计,并与传统的抽样方法比较,综合评价两种抽样方法的优缺点。方法 分别在样本量相同及样本量不同两种情况下对抽样结果估计感染率的绝对误差、相对误差及正确率作统计学描述分析,并综合评价。结果 在相同样本量下,两种抽样方法估计的感染率在绝对误差、相对误差、正确率及可信区间宽度方面差别的P值均大于0.05(当感染率为0.6%时,两者的正确率及可信区间宽度差别P值接近0.05);在样本量不同时,两种抽样方法估计的感染率在正确率方面差异无统计学意义(P值均大于0.05),在绝对误差、相对误差及可信区间方面差别的P值均小于0.01,仅在感染率较高时(大于10%)两者差异无统计学意义。结论 在样本量一致情况下,两种抽样方法在不同的感染率范围内的估计精度相当。当实际感染率较小时(如小于1%),采用负二项分布抽样可实现抽到足够的患者;当实际感染率未知且无法预测时,该方法又是一种探索性的抽样方法。
【关 键 词】负二项分布/血吸虫感染率/随机模拟
????一、研究背景????卫生部分别于1989、1995和2004年开展了第一、二、三次全国血吸虫病流行病学抽样调查,为防治规划提供了科学依据。第三次全国血吸虫病抽样调查,采取分层、整群、随机抽样方法,在抽样范围内抽取样本村作为调查点。抽样范围:湖北、湖南、江西、安徽、江苏、四川和云南七省中,未达到传播阻断标准乡镇的所有流行村。第一亚层:在抽样范围内,根据流行类型划分为8个不同层次:湖沼型流行区湖汊亚型、洲滩亚型,洲垸亚型、垸内亚型,水网型流行区水网亚型,山丘型流行区丘陵亚型、高山峡谷亚型、平坝亚型。第二亚层:在第一亚层的基础上,根据流行区县(市、区)血防所(站)的最近一次查病结果、钉螺分布现状以及多年血防信息的感染率粗略预估计,将各流行村的居民血吸虫估计感染率分为<1%、1%~、5%~、10%~等4个层次。各省每个第二亚层随机抽100个抽样点(行政村),每个抽样点随机抽1000人,并收集人口学资料,并用下列公式估计感染率[1]。????样本点的粪检感染率估计的基本公式??????????????由于一些村的感染率的粗略预估计值远离实际的感染率,造成两种情况:抽样点的实际感染率远大干预估计值,样本量会相对太大而浪费资源;另一种情况是抽样点的实际感染率远低于预估计值,会出现因样本量太小而导致感染率估计的抽样误差大大增大。针对上述实际问题的方法,笔者建议采用负二项分布抽样的方法解决上述问题,推导出负二项分布的感染率无偏估计的公式及方差估计的公式,并用随机模拟比较负二项分布抽样与传统抽样方法的抽样误差情况。????二、方法????(一)负二项分布定义[2]????假定:????1.每次试验的可能结果只有二个:可以归结为成功或失败。????2.每次试验之间是独立,每次成功的概率均为π。????3.第r次成功的试验次数为N,则N的概率分布为??????????????对于实际感染率低于预计时的感染率时,由于以达到预定感染人数为停止抽样准则,所以采用负二项分布的方式抽样,可以证明:不会导致估计误差增大,并且能够根据实际感染情况自动调节抽样人数,保证感染率的估计精度。????根据感染率估计π和95%可信区间的宽度,估计样本量n,并得到估计的感染人数期望值r=nπ,采用抽样的感染阳性人数达到预定的阳性人数,停止抽样。????在这种抽样中,阳性人数不是随机变量,抽样人数是随机变量,描述这样的随机变量可以归结为负二项分布(亦称巴士卡分布)。????三、随机模拟的结果????模拟试验设计:????1.感染率分别为0.6,1%,2.5%,5%和10%,预定阳性人数分别取6,10,25,50,100。先采用负二项分布抽样,得到样本量,再以此样本量用传统方法进行抽样,从而实现两种抽样方法的样本量一致,比较两种抽样方法估计感染率的绝对误差,相对误差和正确率,见表1~表3。????2.每一亚层感染率范围分别为:0.6%~1%,1%~5%,5%~10%,10%~12%,传统抽样方法在每个感染率范围内样本量均为1000,采用负二项分布方法,其患者数为96,96,92,122。比较两种抽样方法估计感染率的绝对误差,相对误差,正确率和95%可信区间平均宽度,见表4~表6。患者数具体计算方法为:?????????表1 固定感染率相同样本下估计感染率的绝对误差|p-π|×100%?????????*:方法一为传统的抽样方法,方法二为负二项分布抽样方法,下同。????表1为固定各亚层的感染
您可能关注的文档
最近下载
- 施工企业现场质量管理制度及奖惩办法.pdf VIP
- 传感器原理及应用 教案.pdf VIP
- 砂石料供应、运输、售后服务方案14627.pdf VIP
- 传承雷锋精神争做时代新人--主题班会课件.pptx VIP
- 气管切开非机械通气患者气道管理考试题及答案.doc
- 横河flxa21两线制电导率变送器快速启动手册.pdf VIP
- 图集规范-天津图集-12J5-1图集(2012版)平屋面 DBJT29-18-2013.pdf VIP
- 第2课+丰富多彩的中华传统体育+课件 2025-2026学年人教版(2024)初中体育与健康八年级全一册.pptx VIP
- 第12课 闭环控制助稳定 教案 义务教育人教版信息科技六年级全一册.pdf VIP
- 生命教育PPT模板.pptx VIP
文档评论(0)