《应用抽样技术》(第二版)附录数据、程序和PPTchapter2 简单随机抽样 程序部分电子版.docx

《应用抽样技术》(第二版)附录数据、程序和PPTchapter2 简单随机抽样 程序部分电子版.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

四、利用R软件完成上述的模拟过程。R软件是常用的统计分析软件,关于R软件的使用说明请参考有关书籍。这里,主要介绍利用R软件完成上述的模拟过程。变量命名参照前文的符号和汉语拼音首字母。首先对变量赋初值。

GL-0.95;

JD-50;

N-345;

nY-40;

GL表示置信概率为95%,JD代表绝对误差界限为50,N代表总体单元总数为345,nY代表预抽样的样本量为40。

为了读取数据,需要将调查数据存在名称“chap2p5.txt”的文件中,并将该文件放在D盘根目录下。文件chap2p5.txt的内容如下。

BH

SM

ZC

LR

1

上海市

29454.30

2253.82

2

重庆市

9321.10

660.35

3

北京市

25321.75

1129.50

343

阿拉尔市

48.09

0.14

344

图木舒克市

19.71

0.51

345

五家渠市

250.61

4.07

文件chap2p5.txt的第1行是每列数据的标题行,第1列名称为“BH”,是市单元编号;第2列名称为“SM”,是市单元名称;第3列名称为“ZC”,是市单元的资产总额;第4列名称为“LR”,是市单元的利润额。从数据文件chap2p5.txt中读取数据,并将数据赋给变量CYK,相应的R语句为

CYK-read.table(D:\\chap2p5.txt,header=T);

将每列数据用数据文件第1行给出的标题命名,相应的R语句为

attach(CYK);

生成了4个变量,分别为BH、SM、ZC、LR,其中变量BH为所有市单元编号,变量SM为所有市单元名称,变量ZC为所有市单元的资产总额,变量LR为所有市单元的利润额。从所有市单元中进行预抽样,抽取容量为nY=40的样本,相应的R语句为

YBH1-sample(BH,nY);

将选中的40个单元编号存在变量YBH1中,则相应的单元标志值为

YB1-LR[YBH1];

选中的40个单元的标志值存放在变量YB1中。采用R软件的函数mean(YB1)和var(YB1),计算标志值YB1的样本均值和样本方差。计算样本量的函数为YBL(FC,GL,JD,N),其中变量FC代表估计量的方差,GL为置信概率,JD为绝对误差界限,N代表总体的单元总数。

YBL-function(FC,GL,JD,N)

{

YBL-ceiling(qnorm(GL/2+0.5)^2*FC/JD^2);

if(YBL0.05*N)

{

YBL-ceiling(YBL/(1+YBL/N));

}

}

n-YBL(var(YB1),GL,JD,N);

最后1行的语句是将样本量赋给变量n。按照本文的计算结果,n的值为80,需要追加的样本量为n-nY。从余下的市单元中进行简单随机抽样,相应的R语句为

YBH2-sample(BH[-c(YBH1)],n-nY);

追加样本的单元编号存在变量YBH2中。所有抽中单元的标志值为

YB-LR[c(YBH1,YBH2)];

选中n个市单元的标志值存放在变量YB中。用样本方差代替总体方差,计算简单估计量的方差为

GJFC-var(YB)*(1-n/N)/n;

变量GJFC为简单估计量的方差,数值为584.45。在置信概率GL=0.95下,绝对误差范围为

JDZ-qnorm(GL/2+0.5,0,1)*sqrt(GJFC);

变量JDZ为在置信概率GL下绝对误差范围,数值为47.38。由于样本量已经满足了估计量的精度要求。n为最终确定的样本量,YB为所抽取的样本单元标志值。

对于每个市单元规模以上工业企业平均利润额的估计,相应的R语句为

JZGJ-mean(YB);

JZFC-var(YB)*(1-n/N)/n;

JZBZC-sqrt(JZFC);

JZQJX-JZGJ-qnorm(GL/2+0.5,0,1)*JZBZC;

JZQJS-JZGJ+qnorm(GL/2+0.5,0,1)*JZBZC;

变量JZGJ为每个市单元规模以上工业企业平均利润额的估计值,数值为185.31;变量JZFC为每个市单元规模以上工业企业平均利润额估计量的方差估计,数值为584.45;变量JZBZC为标准差估计,数值为24.18;变量JZQJX为在置信概率GL下置信区间的置信下限,数值为137.92;变量JZQJS为在置信概率GL下置信区间的置信上限,数值为232.70。

对于全国市单元规模以上工业企业利润总额的估计,相应的R语句为

ZZGJ-mean(YB)*N;

ZZFC-var(YB)*(1-n/N)/n*

文档评论(0)

医药前沿 + 关注
实名认证
内容提供者

专业医药相关文档服务

1亿VIP精品文档

相关文档