抽样调查作业二R语言..docxVIP

下载本文档

828
0
约4.44千字
约 8页
2017-01-11 发布于重庆
举报
版权申诉

抽样调查作业二R语言..docx

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

抽样调查作业二R语言.

抽样调查学号：2013104874 姓名：孙影莉班级：统计学131一、作业要求：1、利用R软件进行相关运算，给出运算结果；2、逐一给出每题的R代码及其相应的运行结果；3、作业以word文档提交，命名格式为“学号姓名作业二”。二、作业题目：P104.3.3题：某居委会辖有三个居民新村，居委会欲对居民购买彩票的情况进行调查。调查者考虑以新村分层，在每个新村中随机抽取了10个居民户并调查每户最近一个月购买彩票所花费的金额（元），结果列于下表:问题：（1）试估计该小区居民户购买彩票的平均支出，并给估计的标准差。（2）当置信度为95%，要求极限相对误差不超过10%时，按比例分配和按内曼分配时样本量及各层的样本量分别为多少？解答：（1）首先计算出每层的简单估计量: ybar1、ybar2、ybar3=分别为,其中，N1、N2、N3分别为：，N=。然后求出每层的层权w1、w2、w3分别为：利用分层随机抽样得到该小区居民购买彩票的平均支出的估计量ybar= 购买彩票的每层的平均支出样本方差sh1^2、sh2^2、sh3^2为：然后fh1 、fh2、 fh3分别得：(Nh*yh)1、 (Nh*yh) 2、(Nh*yh) 分别是：总和为：根据以上数据整理成表格为：然后求得方差的估计值为vybar= 则估计的标准差为sybar= （2）a、比例估计：总体n= ,n1、 n2、n3分别为：n、n1、 n2、n3分别约等于: 185、56、92、37b、内曼估计：总体n= ,n1、 n2、n3分别为：n、n1、 n2、n3分别约等于: 175、33、98、42代码如下：setwd(C:\\Users\\user\\Desktop\\新建文件夹)dat - read.csv(syl3.3.csv,header=F)View(dat)alpha - 0.05nh - 10Nh - dat[,2]N-sum(Nh)Wh-Nh/Nw-sum(Wh)#检验Wh是否正确fh-nh/Nhyh- 1:nrow(dat) # rep(0,nrow(dat)) sh2-1:nrow(dat)yh- rowSums(dat[,3:12])/nhYh- Nh*yhY-crossprod(Nh,yh)ybar-sum(Wh*yh)var_ybar-sum(Wh^2*(1-fh)/nh*sh2)sybar-sqrt(var_ybar)for(i in 1:nrow(dat)){yh[i]- mean(as.numeric(dat[i,3:12])) sh2[i]- sd(dat[i,3:12])^2}# 比例分配r-0.1a-sum(Wh*sh2)b-(0.1*ybar/qnorm(1-alpha/2))^2n-a/(b+a/N) #总数n1- n*Wh #各分层样本数# 内曼估计a1 -sum(Wh*sqrt(sh2))n2 -a1^2/(b+a/N) #总数n22 -n2*Wh*sqrt(sh2)/a1 #各分层样本数P104.3.4题：随着经济发展，某市民正在悄悄的改变他们的过年习惯，虽然仍有大多数选择除夕夜在家吃年夜饭、看电视节目，但也有一些家庭到饭店吃年夜饭或逛夜市，或利用春节假期到处旅游。为研究这种现象，某研究机构以市中心165万居民户作为研究对象，将居民户按6个行政区分层，在每个行政区随机抽取30户居民户进行了调查（各层抽样比可以忽略），每个行政区的情况以及在家（或亲戚家）吃年夜饭、看电视节目的居民数见下表：问题：试估计该市区居民在家吃年夜饭的比例，并给出估计的标准差。当置信度为95%，要求极限绝对误差不超过1%时，按比例分配和内曼分配时总样本量及各层的样本量分别为多少？解答：（1）：首先计算得到每层在家中吃年夜饭的样本比例分别为：那么根据每一层的层权，计算得到该市民在家吃年夜饭的样本比例为：Pst=每一层在家吃年夜饭的样本比例的方差为：V(Pn)=样本比例方差的估计值为：V（Pst）=该估计值的标准差为：s(Pst)=所以估计量的标准差为1.99%，比例为9.24%(2)、a、比例分配的条件下：n=约等于2659所以n1、n2、n3、n4、n5、n6分别为：n1= 479、n2=559、n=373、n4=240、n5=426、n6=586由于n1+n2+n3+n4+n5+n6=n所以n=2663.b、内曼分配n2=约等于2561所以n1、n2、n3、n4、n5、n6分别为：n1= 536、n2=520、n=417、n4=304、n5=396、n6=392由于n1+n2+n3+n4+n5+n6=n所以n=2565.程序代码如下：setwd(C:\\Users\\user\\Desktop\\新建文件夹)dat - read.csv(syl3.4.csv,heade