PPS抽样在我国建筑业总值参数估计中应用.docVIP

PPS抽样在我国建筑业总值参数估计中应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PPS抽样在我国建筑业总值参数估计中应用

PPS抽样在我国建筑业总值参数估计中应用   摘 要:本文以2012年我国31个省市自治区的规模以上建筑业企业单位数为基础,运用PPS抽样的代码法对总体各个单元进行编码,并在此基础上用等距抽样方法抽取了10个样本地区,以此估计2012年我国建筑业总值,并给出95%置信度下的置信区间,实证分析表明:该抽样方法得到估计值与真实值较为接近,真实值落也在置信区间内。   关键词:不等概抽样;PPS抽样;等距抽样;建筑业总值   建筑业是我国经济发展的支柱产业之一,它的健康发展对我国经济的快速发展有着举足轻重的作用。为了解我国建筑业的总体发展情况,可采用抽样调查的方法对我国31个省市自治区建筑业总值进行研究。最简单的抽样方法是简单随机抽样方法(simple random sampling),该方法具有总体中每个单元进入样本的概率严格相等的优点,是一种等概率抽样方法。但是,在总体单元之间差异非常大时,简单随机抽样效果并不是很好。而我国各个地区建筑业企业单位数存在较大差异,所以,本文运用PPS抽样方法对我国建筑业总值进行抽样研究。   1.抽样方法简介   不等概率抽样(sampling with unequal probabilities),是指在抽样中每个单元都具有一定的入样概率,但不是严格相等。它分为放回与不放回两种情况。最常用的放回不等概抽样是PPS抽样(probability proportional to size),它是一种与规模大小成比例的抽样方法,包括代码法和拉稀里(Lahiri)法两种实施办法。在PPS抽样中,一般把Mi作为总体中第i个单元的大小或者规模的度量,M0为总体各单元规模的累积和,即总体的规模大小,若在每次抽样中第i个单元被抽中的概率用Zi表示,则有以下式子成立:Zi=MiM0。   一般情况下,放回抽样比不放回抽样的效率低,因为在放回抽样的实施过程中,某个单元有可能被抽中的多次,而从直观上看,在抽样调查过程中,没有必要对同一个单元调查多次。   等距抽样是一种先将总体按某种顺序进行排序,并确定抽样间距k,并在1~k范围内产生一个随机起点r,然后按照固定间隔k依次选取其他单元的编号,直到抽满n个为止,这样最终入样本编号为:r+(j-1)k,j=1,2,…,n,具有简单易行和使得样本在总体中分布更均匀的优点。一般情况下,等距抽样方法是一种不放回的抽样方法。因此,本文考虑在PPS抽样的基础上,采用等距抽样方法进行抽样研究。这种方法抽取样本比较容易,并且每个单元的被抽中概率与Mi的大小成比例,具有等距抽样的优点。   2.抽样实施方法   假设总体单元数目为N,总体中第i个单元规模大小的为Mi,欲抽取n个样本,则具体的实施步骤为:先用PPS抽样中的代码法,赋予每个单元与Mi相等的代码数,将代码数进行累积,直至M0=∑Ni=1Mi;其次,确定等距抽样的间隔k=M0n;再次,在1~k之间产生一个随机起点,假设为r,则r所在的单元代码区间相应的单元为被抽中的单元;最后,找出r+(j-1)k,j=1,2,…,n所在的代码区间,则相应单元为被抽中的单元。这种抽样方法的特点是当所有单元的度量Mik时,则第i个单元有可能被重复抽中;当Mi2k时,则第i个单元肯定会被重复抽中。   3.汉森―赫维茨估计量   汉森―赫维茨(Hansen-Hurwitz)估计量指是采用有放回不等概抽样抽取样本容量n时,总体总值的估计量为样本所有yiZi的平均,即HH=1n∑ni=1yizi,它是总体总值的无偏估计量。   如果采用的PPS抽样,即Zi=MiM0,则   HH=1n∑ni=1yizi=M0n∑ni=1yiMi(1)   总体总值估计量方差为:   VHH=1n∑ni=1ZiYiZi-Y2.   总体总值估计量方差的无偏估计量为:   vHH=1n1n-1∑ni=1yizi-HH2.(2)   4.样本的抽取   为了估计2012年我国建筑业生产总值这一参数,本文以2012年我国31个省、市、自治区的规模以上建筑业企业单位数作为衡量各个地区规模大小的标准,运用PPS抽样和等距抽样方法,抽取10个样本地区,以此估计2012年我国建筑业生产总值,具体抽样步骤如下:   (1)以2012年我国31个省、市、自治区的规模以上建筑业企业单位数作为规模Mi,并进行累计,具体如表1所示。   (2)由于M0=∑Ni=1Mi=75280,因而得出抽样间隔   k=M0n=7528010=7528.   (3)在1~k范围内产生一个随机起点r,假设为r=4875,处于河北代码范围内,故河北进入样本。   (4)根据等距抽样的入样代码:4875+(j-1)7528,j=1,2,…,10,确定进入样本的10个地

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档