- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样调查-第2节简单随机抽样
1.简单随机抽样是等概抽样,即每个总体单元都有相同的入样概率; 2.随机抽取是有严格要求的,不是随便抽取,必须按照某一随机原则进行。 引理二 从总体规模为N的总体中抽取一个样本量为n的简单随机样本。若对总体中的每个单元 ,引进随机变量 如下: 有了这些准备,我们很容易证明 证明方法一 证明方法二:由定义 因此有 设N个样本单元中有N1个具有某一特性,即有N1个单元取值为1,有N-N1个单元取值为0. (二) 计算机产生的伪随机数 利用软件中的随机函数可产 生所需要的随机数,这种方法产生随机数称为伪随机数,虽然方便,但并不能保证其随机性,因为这些伪随机数有循环周期,当然,我们希望产生的伪随机数循环周期越长越好。在可能的条件下,建议还是利用随机数表来产生随机数。 【解】 1、在简单估计条件下, 的95%的近似置信区间为: 此处教材有误(P51) 2、在比率估计条件下, 的95%的近似置信区间为: 下面我们从理论上来比较简单估计与比率估计的误差 比率估计量精度高于简单估计量的充要条件是: 也就是说, 比率估计比简单估计更为精确。 尤其是当 时,只要相关系数 , 比率估计就要优于简单估计。 比率估计的其他问题看教材P53 §2.4 回归估计量及其性质 一、回归估计的定义 对于简单随机抽样,总体均值 和总体总量 的回归估计量(regression estimatior)的定义为: 式中, 是样本均值; 为事先设定的一个常数 如果β=0,则回归估计量就是简单估计量; 如果 则回归估计量就是比率估计量。 二、 为常数的情形 当回归系数 为事先给定的常数时,或以前为 相同目的进行的调查所得到的 对 的样本回 归系数 稳定在某个数值上,取最近一次调查 所得的 作为设定值。 性质2 对于简单随机抽样回归估计量,作为 及Y 的回归估计, 都是无偏的。即 的方差分别为: 式中, 分别是Y,X的总体方差和总体 协方差; 分别是Y,X的样本方差和样本 协方差。 的样本估计量为: 我们对上式两端关于 求导数,得: 因此当 取总体回归系数 达到最小,即 时, 式中, 为 总体相关系数。 三、β为样本回归系数的情形 如果β需要通过样本来确定,很自然地, 我们会想到用总体回归系数的最小二乘估计, 也就是样本回归系数: 这时简单随机抽样回归估计量 是有偏的。但当样本量 n充分大时,估计量的偏倚趋于零。因此,类似 比率估计量,回归估计量也是渐近无偏的。 且有 的一个近似估计为: 【例4.5】(续P72的例4.2)利用回归估计量推算该县船舶 调查月完成的货运量. 解:根据例4.2中的计算结果可得样本回归系数: 从而 因此,该县船舶调查月完成的货运量的回归 估计为: 为了估计 ,先计算回归残差方差: 所以 对于同一个题,我们来比较三种估计量的误差差异 ●与例4.2的结果比较,对于本问题回归估计优于比率估计,而比率估计又优于简单估计; ●回归估计优于比率估计的原因是回归直线可以不通过原点。 ●比较上述估计量的优劣,一般是通过比较它们的均方误差或方差大小来进行。 关于简单估计、比率估计、 回归估计的估计量方差比较 简单估计量: 比率估计量: 回归估计量: 由此可以看出(在不考虑偏倚的情况下)有以下结论: 2.比率估计量优于简单估计量的条件是: 3.回归估计量优于比率估计量的条件是: 在不考虑偏倚时,回归估计总是优于比率估计 1.回归估计量总是优于简单估计量,除非 即一般而言有 如果不忽略偏倚,全面考虑比率估计 和回归估计的均方误差MSE,那情况会怎 么样呢? 下面我们通过教材P61.表2—13的实际 例题来分析比较。(略,看教材) §2.4 简单随机抽样的实施 一、样本量的确定原理 我们知道n的大小会影响抽样误差,因为如果 n越接近N,则抽样误差就会越接近于零,这一点 也清楚地体现在下面的式子里。 三个因素决定 n 同理对样本方差有 因此 同样下面我们从关系式 可以推出 估计量的方差 是衡量估计量精度的度量。 从式 可以看出,影响估计量方差的因素有: ①样本量n; ③总体未入样比率1-f ②总体方差 分析见教材P38,39 N通常很大,当f0.05时,可将1-f近似取为1,这时影响估计量方差的主要因素是样本量n和总体方差 。 的大小是我们无法改变的,因此,要提高估计量的精度就只有加大样本量。 注 意 【例2.3】我们从某个N=100的总体中抽出一个 大小为n=10的简单随机样本,要估计总体平均水 平并给出置信
文档评论(0)