- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
四、利用R软件完成上述模拟过程
对于两级抽样,需要事前已知总体群数和要抽取的群数,将其赋予如下变量。
M-12779;
N-367;
n-45;
m-5;
为了读取群单元名称和群单元总数,将包含群单元编号、群单元名称和群内基本单元总数的文件“FWY.CSV”,放在D盘根目录下,内容如下。
BH
CJDY
DCXQ
1
120101001005
14
2
120101001006
13
3
120101001012
10
4
120101002014
33
5
120101003003
12
……
……
……
363
120225100242
10
364
120225100246
16
365
120225100249
10
366
120225106701
70
367
120225114214
13
总计
12799
文件FWY的第1行是每列数据的标题行,第1列“BH”是村级单元的编号,第2列“CJDY”是村级单元的代码,第3列“DCXQ”是村级单元包含的调查小区数量。从数据文件FWY.CSV中读取数据,并将数据赋给变量FWY,相应的R语句为
FWY-read.csv(D://FWY.csv,sep=,,header=TRUE);
attach(FWY);
生成了3个变量,分别为BH、CJDY、DCXQ,其中变量BH为编号,变量CJDY为村级单元编号,变量DCXQ为村级单元包含的调查小区个数。不放回等概率抽群的两级抽样,抽取容量为n=45的样本,将选中的45个编号存在变量QDY中。相应的R语句为
QDY-sample(BH,n);
YBQNDYS-aggregate(QDYYB$DCXQ,by=list(QDYYB$BH),FUN=max)[,2];
为了方便,每个村级单元的全部调查小区的规模以下服务业企业营业收入数据存放在同一文件中,文件名为FWYSAMPLE.CSV。部分数据格式如表6.25,文件命名为FWYSAMPLE.CSV。文件FWYSAMPLE的第1行是每列数据的标题行,第1列名称为“BH”,是编号,第2列为“CJDY”,是村级单元编码,第3列名称为“XQBH”,是村级单元中调查小区的编号,第4列名称为“YYSR”,是村级单元中每个调查小区的营业收入。
BH
CJDY
XQBH
YYSR
7
120101003019
1
440
7
120101003019
2
249
……
……
……
……
7
120101003019
17
161
7
120101003019
18
639
……
……
……
……
356
120225001018
1
520
356
120225001018
2
479
……
……
……
……
356
120225001018
16
540
356
120225001018
17
160
从数据文件FWYSAMPLE.CSV中读取数据进行第二级抽样,采用简单随机抽样从所抽取的村级单元中独立抽取调查小区,相应R语言为
YYLRYB-list()
for(iin1:length(QDY)){
FWYi-FWY[FWY$BH==QDY[i],]
YYLRYB[[i]]-sample(FWYi$YYSR,m)
}
YYSRYB-do.call(cbind,YYLRYB)
将所抽取的最终样本数据合并到一起,变量赋值为YYSRYB。计算每个村级单元的样本均值和样本方差,相应R语句为
YYSRYBJZ-apply(YYSRYB,2,mean)
YYSRYBFC-apply(YYSRYB,2,var)
将每个村级单元的群均值和方差分别赋给变量YYSRYBJZ和YYSRYBFC。对于该地区12779个调查小区的规模以下服务业企业营业收入估计,相应的R语句为
ZZGJ-N*sum(YBQNDYS*YYSRYBJZ)/n;
将营业收入估计值赋给变量ZZGJ。计算估计量的方差估计,相应的R语句为
ZZFCGJ-N^2*(1-n/N)/n*var(YBQNDYS*YYSRYBJZ)+N*mean(YBQNDYS^2*YYSRYBFC*(1-m/YBQNDYS)/m);
ZZBZCGJ-sqrt(ZZFCGJ);
将方差估计赋给变量ZZFCGJ,将标准差估计赋给变量ZZBZCGJ。每个调查小区的规模以下服务业企业的平均营业收入的估计、方差估计和标准差估计,相应的R语句为
JZGJ-ZZGJ/M;
JZFCGJ-ZZFCGJ/M^2;
JZBZCGJ-ZZBZCGJ/M;
将平均营业收入的估计值赋给变量JZGJ,将方差估计赋给变量JZFCGJ,将标准差估计赋给变量JZBZCGJ。
对于规模以下服务业企业的营业收入为580万元及以上的调查小区总数的估计值、方差估计和标准差估计,相应的
您可能关注的文档
- 统计模型与统计实验大纲(新).doc
- 《统计学原理》(第二版)课件统计学原理CH1.ppt
- 《统计学原理》(第二版)课件CH3 统计调查与整理.ppt
- 《统计学原理》(第二版)课件CH4 样本信息的提取CH4(1).ppt
- 《统计学原理》(第二版)课件CH4 样本信息的提取CH4(2).ppt
- 《统计学原理》(第二版)课件CH5 参数估计5.1.ppt
- 《统计学原理》(第二版)课件CH5 参数估计5.2.ppt
- 《统计学原理》(第二版)课件CH5 参数估计5.3-5.4.ppt
- 《统计学原理》(第二版)课件CH6 假设检验6.1-6.2.ppt
- 《统计学原理》(第二版)课件CH6 假设检验6.3-6.5.ppt
文档评论(0)