- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
§5.1 不等概抽样; 什么时候使用不等概抽样?
实际工作中,如果遇到下面几种情况,则可以考虑使用不等概抽样:
1、抽样单元在总体中所占的地位不一致
2、调查的总体单元与抽样总体的单元不一致
3、改善估计量;二、不等概抽样的种类; 放回不等概抽样中,最常用的是按照整体单元的规模大小来确定单元在每次抽样时的入样概率,假设总体中第i个单元的规模度量为 ,总体的总规模为 每次抽样中,第i个单元被抽中的概率用 表示,其中; 这种不等概抽样??作放回的与规模大小成比例的概率抽样( ),简称抽样。实际问题中,总体单元大小的度量往往不止一个,比如企业员工数量、产值、销售量、利润等都可以度量企业规模的大小。
抽样的实施主要有两种方法:代码法和拉希里()法,下面我们用一个实例分别介绍这两种方法。;代码数,将代码数累加得到;;先在[1,738]中产生一个随机数为354,再在[1,738]中产生第二个随机数为553,最后产生第三个随机493。则它们所对应的第5,7,6号单元被抽中。;(2)拉希里法;(3,121),;2、不放回不等概抽样
每次在总体中对每个单元按入样概率进行抽样,抽取出来的样本单元不放回总体,对总体中剩下的单元进行下一次抽样。不放回不等概抽样的效率比放回时的效率高,但是样本不独立会加大抽样实施、参数估计及精度计算的难度。;对于不放回不等概抽样,样本的抽取可以有以下几种方法:
(1)逐个抽取法。每次从总体未被抽中的单元中以一定的概率取一个样本单元。
(2)重抽法。以一定的概率逐个进行放回抽样,如果抽到重复单元,则放弃所有抽到的单元,重新抽取。
(3)全样本抽取法。对总体每个单元分别按一定概率决定其是否入样。这种方法的样本量是随机的,事先不能确定。
(4)系统抽样法。将总体单元按某种顺序排列,根据样本量确定抽样间距k,在[1,k]中产生一个随机数。;§5.2 放回不等概抽样;超市; 如果超市的营业面积近似正比于超市的销售额,
那么超市A的销售额就占所有超市销售额的1/16,因
此超市A的销售额乘以权重16(包含概率的倒数)
可以近似地估计所有超市的销售额。因此,样本量
为1的不等概抽样的总体总值估计量为:;样本;从上表可以算出:; 我们用同一个例题将不等概抽样与简单随机抽样
作一比较,以此认识不等概抽样的意义。
与1的简单随机抽样相比,简单随机抽样的样本;样本;我们来计算简单随机抽样的估计量方差;二、一般有放回不等概抽样;如果采用的是PPS抽样,即 ,则;【例5.2】某部门要了解所属8500家生产企业当月完成
的利润,该部门手头已有一份上年各企业完成产量的报告
,将其汇总得到所属企业上年完成产量为3676万吨.考虑
到时间紧,准备采用抽样调查来推算当月完成的利润.根
据经验,企业的产量和利润相关性比较强,且企业的特点
是规模和管理水平差异比较大,通常大企业的管理水平
较高,因此采用与上年产量成比例的抽样,从所属企
业中抽出一个样本量为30的样本,调查结果如下表.;i; 要根据以上调查结果估计该部门所属企业当月完成
的利润,并给出95%置信度下的相对误差.如果要求在相同
条件下相对误差达到20%,所需的样本量应该是多少?;方差及标准差的估计; 因此,在置信度仍为95%、相对误差时 ,
所需样本量为:;三、有放回不等概整群抽样
在群规模不等的整群抽样中,如果群的规模
差异较大,各个群对总体的影响会产生很大差别。
这时可以采用不等概方式抽取群。其好处是把群
的规模作为抽取样本的辅助信息,提高了估计的
精度,而且方差估计有比较简单的形式。下面主
要讨论以抽样抽取群的情况。; 每次按
的概率抽取第i个群,由于群内的单元全部参与调查,
第i个群的总值为:;估计量的方差是:;【例5.3】 某企业欲估计上季度每位职工的平均病
假天数。该企业共有8个分厂(工人数资料见下表),
现用不等概整群抽样拟抽取三个分厂为样本,并以
95%的置信度计算其置信区间。有关数据及抽样过程
如下:;分厂编号;【解】 采用PPS抽样,利用随机数表在数字
1~12950之间随机抽取3个数,分别是02011,
07972和10281,于是3分厂、6分厂和8分厂入
选样本。用 分别表示三个分厂职工
的病假天数,调查结果为:;同样可求得估计量方差的估计值为:;【评价】 对于群规模不等的整群抽样,采用不等
概抽样,可以得到总体目标量的无偏估计,估计
量和估计量方差都
文档评论(0)