《应用抽样技术》(第二版)附录数据、程序和PPTchapter7 两级抽样 程序部分电子版.docx

《应用抽样技术》(第二版)附录数据、程序和PPTchapter7 两级抽样 程序部分电子版.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

四、利用R软件完成上述模拟过程

对于两级抽样,需要事前已知总体群数和要抽取的群数,将其赋予如下变量。

M-12779;

N-367;

n-45;

m-5;

为了读取群单元名称和群单元总数,将包含群单元编号、群单元名称和群内基本单元总数的文件“FWY.CSV”,放在D盘根目录下,内容如下。

BH

CJDY

DCXQ

1

120101001005

14

2

120101001006

13

3

120101001012

10

4

120101002014

33

5

120101003003

12

……

……

……

363

120225100242

10

364

120225100246

16

365

120225100249

10

366

120225106701

70

367

120225114214

13

总计

12799

文件FWY的第1行是每列数据的标题行,第1列“BH”是村级单元的编号,第2列“CJDY”是村级单元的代码,第3列“DCXQ”是村级单元包含的调查小区数量。从数据文件FWY.CSV中读取数据,并将数据赋给变量FWY,相应的R语句为

FWY-read.csv(D://FWY.csv,sep=,,header=TRUE);

attach(FWY);

生成了3个变量,分别为BH、CJDY、DCXQ,其中变量BH为编号,变量CJDY为村级单元编号,变量DCXQ为村级单元包含的调查小区个数。不放回等概率抽群的两级抽样,抽取容量为n=45的样本,将选中的45个编号存在变量QDY中。相应的R语句为

QDY-sample(BH,n);

YBQNDYS-aggregate(QDYYB$DCXQ,by=list(QDYYB$BH),FUN=max)[,2];

为了方便,每个村级单元的全部调查小区的规模以下服务业企业营业收入数据存放在同一文件中,文件名为FWYSAMPLE.CSV。部分数据格式如表6.25,文件命名为FWYSAMPLE.CSV。文件FWYSAMPLE的第1行是每列数据的标题行,第1列名称为“BH”,是编号,第2列为“CJDY”,是村级单元编码,第3列名称为“XQBH”,是村级单元中调查小区的编号,第4列名称为“YYSR”,是村级单元中每个调查小区的营业收入。

BH

CJDY

XQBH

YYSR

7

120101003019

1

440

7

120101003019

2

249

……

……

……

……

7

120101003019

17

161

7

120101003019

18

639

……

……

……

……

356

120225001018

1

520

356

120225001018

2

479

……

……

……

……

356

120225001018

16

540

356

120225001018

17

160

从数据文件FWYSAMPLE.CSV中读取数据进行第二级抽样,采用简单随机抽样从所抽取的村级单元中独立抽取调查小区,相应R语言为

YYLRYB-list()

for(iin1:length(QDY)){

FWYi-FWY[FWY$BH==QDY[i],]

YYLRYB[[i]]-sample(FWYi$YYSR,m)

}

YYSRYB-do.call(cbind,YYLRYB)

将所抽取的最终样本数据合并到一起,变量赋值为YYSRYB。计算每个村级单元的样本均值和样本方差,相应R语句为

YYSRYBJZ-apply(YYSRYB,2,mean)

YYSRYBFC-apply(YYSRYB,2,var)

将每个村级单元的群均值和方差分别赋给变量YYSRYBJZ和YYSRYBFC。对于该地区12779个调查小区的规模以下服务业企业营业收入估计,相应的R语句为

ZZGJ-N*sum(YBQNDYS*YYSRYBJZ)/n;

将营业收入估计值赋给变量ZZGJ。计算估计量的方差估计,相应的R语句为

ZZFCGJ-N^2*(1-n/N)/n*var(YBQNDYS*YYSRYBJZ)+N*mean(YBQNDYS^2*YYSRYBFC*(1-m/YBQNDYS)/m);

ZZBZCGJ-sqrt(ZZFCGJ);

将方差估计赋给变量ZZFCGJ,将标准差估计赋给变量ZZBZCGJ。每个调查小区的规模以下服务业企业的平均营业收入的估计、方差估计和标准差估计,相应的R语句为

JZGJ-ZZGJ/M;

JZFCGJ-ZZFCGJ/M^2;

JZBZCGJ-ZZBZCGJ/M;

将平均营业收入的估计值赋给变量JZGJ,将方差估计赋给变量JZFCGJ,将标准差估计赋给变量JZBZCGJ。

对于规模以下服务业企业的营业收入为580万元及以上的调查小区总数的估计值、方差估计和标准差估计,相应的

文档评论(0)

医药前沿 + 关注
实名认证
内容提供者

专业医药相关文档服务

1亿VIP精品文档

相关文档