抽样调查作业二R语言..docxVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样调查作业二R语言.

抽样调查学号:2013104874 姓名:孙影莉班级:统计学131一、作业要求:1、利用R软件进行相关运算,给出运算结果;2、逐一给出每题的R代码及其相应的运行结果;3、作业以word文档提交,命名格式为“学号姓名作业二”。二、作业题目:P104.3.3题:某居委会辖有三个居民新村,居委会欲对居民购买彩票的情况进行调查。调查者考虑以新村分层,在每个新村中随机抽取了10个居民户并调查每户最近一个月购买彩票所花费的金额(元),结果列于下表:问题:(1)试估计该小区居民户购买彩票的平均支出,并给估计的标准差。(2)当置信度为95%,要求极限相对误差不超过10%时,按比例分配和按内曼分配时样本量及各层的样本量分别为多少?解答:(1)首先计算出每层的简单估计量: ybar1、ybar2、ybar3=分别为,其中,N1、N2、N3分别为:,N=。然后求出每层的层权w1、w2、w3分别为:利用分层随机抽样得到该小区居民购买彩票的平均支出的估计量ybar= 购买彩票的每层的平均支出样本方差sh1^2、sh2^2、sh3^2为:然后fh1 、fh2、 fh3分别得:(Nh*yh)1、 (Nh*yh) 2、(Nh*yh) 分别是:总和为:根据以上数据整理成表格为:然后求得方差的估计值为vybar= 则估计的标准差为sybar= (2)a、比例估计:总体n= ,n1、 n2、n3分别为:n、n1、 n2、n3分别约等于: 185、56、92、37b、内曼估计:总体n= ,n1、 n2、n3分别为:n、n1、 n2、n3分别约等于: 175、33、98、42代码如下:setwd(C:\\Users\\user\\Desktop\\新建文件夹)dat - read.csv(syl3.3.csv,header=F)View(dat)alpha - 0.05nh - 10Nh - dat[,2]N-sum(Nh)Wh-Nh/Nw-sum(Wh)#检验Wh是否正确fh-nh/Nhyh- 1:nrow(dat) # rep(0,nrow(dat)) sh2-1:nrow(dat)yh- rowSums(dat[,3:12])/nhYh- Nh*yhY-crossprod(Nh,yh)ybar-sum(Wh*yh)var_ybar-sum(Wh^2*(1-fh)/nh*sh2)sybar-sqrt(var_ybar)for(i in 1:nrow(dat)){yh[i]- mean(as.numeric(dat[i,3:12])) sh2[i]- sd(dat[i,3:12])^2}# 比例分配r-0.1a-sum(Wh*sh2)b-(0.1*ybar/qnorm(1-alpha/2))^2n-a/(b+a/N) #总数n1- n*Wh #各分层样本数# 内曼估计a1 -sum(Wh*sqrt(sh2))n2 -a1^2/(b+a/N) #总数n22 -n2*Wh*sqrt(sh2)/a1 #各分层样本数P104.3.4题:随着经济发展,某市民正在悄悄的改变他们的过年习惯,虽然仍有大多数选择除夕夜在家吃年夜饭、看电视节目,但也有一些家庭到饭店吃年夜饭或逛夜市,或利用春节假期到处旅游。为研究这种现象,某研究机构以市中心165万居民户作为研究对象,将居民户按6个行政区分层,在每个行政区随机抽取30户居民户进行了调查(各层抽样比可以忽略),每个行政区的情况以及在家(或亲戚家)吃年夜饭、看电视节目的居民数见下表:问题:试估计该市区居民在家吃年夜饭的比例,并给出估计的标准差。当置信度为95%,要求极限绝对误差不超过1%时,按比例分配和内曼分配时总样本量及各层的样本量分别为多少?解答:(1):首先计算得到每层在家中吃年夜饭的样本比例分别为:那么根据每一层的层权,计算得到该市民在家吃年夜饭的样本比例为:Pst=每一层在家吃年夜饭的样本比例的方差为:V(Pn)=样本比例方差的估计值为:V(Pst)=该估计值的标准差为:s(Pst)=所以估计量的标准差为1.99%,比例为9.24%(2)、a、比例分配的条件下:n=约等于2659所以n1、n2、n3、n4、n5、n6分别为:n1= 479、n2=559、n=373、n4=240、n5=426、n6=586由于n1+n2+n3+n4+n5+n6=n所以n=2663.b、内曼分配n2=约等于2561所以n1、n2、n3、n4、n5、n6分别为:n1= 536、n2=520、n=417、n4=304、n5=396、n6=392由于n1+n2+n3+n4+n5+n6=n所以n=2565.程序代码如下:setwd(C:\\Users\\user\\Desktop\\新建文件夹)dat - read.csv(syl3.4.csv,heade

您可能关注的文档

文档评论(0)

kakaxi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档