《抽样与抽样分布》1-3节课堂知识汇总及典型例题.docVIP

《抽样与抽样分布》1-3节课堂知识汇总及典型例题.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE \* MERGEFORMAT 8 第五章 抽样与抽样分布 第一节 抽样的基本概念 一、几个基本概念 1、目标总体和抽样总体 目标总体就是研究对象的全体。抽样总体是指从中抽取样本的总体。二者理应一致,但实际中有时难以保证。 2、抽样单元和抽样框 抽样总体的具体表现就是抽样框,通常是一份包含所有抽样单元的名单,好的抽样框应该尽可能多地提供与研究目标有关的辅助信息。抽样单元是构成抽样框的基本单位,可以是一个个体,也可以包含若干个个体,还可以分级。分级情况下,总体由若干个较大规模的抽样单元组成,为初级单元,每个初级单元又包含若干个规模较小的单元,为二级单元,以此类推。抽取哪一级,就需要有哪一级的抽样框。 3、抽样误差和非抽样误差 抽样误差是抽取样本的随机性造成的样本值和总体值之间的差异。只要采用抽样调查,抽样误差就不可避免,但可通过增大样本量来减小误差。非抽样误差是由于其他多种原因引起的样本值和总体值之间的差异。 三、抽样方案设计 1、抽样设计步骤: 明确调查目的,确定研究对象,确定目标量; 明确总体及抽样单元;(根据总体的定义,收集一份全部个案的名单) 对主要目标量的精度提出要求(误差控制在多大范围内); 选择抽样方法; 根据抽样方法、精度要求等确定样本量,并估计抽样误差; 制定具体步骤。 2、设计原则 (1)随机性原则——总体中所有个体被抽中机会相等。 (2)抽样效果最佳原则——在固定费用下,抽样误差最小;在要求精度下,费用最少。 第二节 抽样方法 一、随机抽样 1、简单随机抽样:最基本的抽样方法,最符合随机原则,每个个体都有同样的被抽中概率。是其它复杂抽样设计的基础。使用随机数表。 2、分层抽样:将总体按照某些特征分成若干个层,在每一层当中独立抽取若干子样本。要求组内同质性强,组间差异大。由于在每层中都抽取出一些样本,样本具有较好的均匀性,代表性更强。 3、整群抽样:先将总体划分为若干群,然后以群为初级抽样单元,从中随即抽取n个群,对抽中的裙内的所有次级单元都进行调查。要求群内差异大,群间差异小。组织上方便,但抽样单元过于集中,抽样误差最大。 4、系统抽样:按照某种顺序给总体中的N个单元编号,然后随机抽取一个编号作为样本的第一个单元,其它单元则按照某种确定的规则抽取。最常见的是等距抽样,按照相等的距离抽取样本。尽可能按照与调查项目有关的变量的大小顺序进行排序总体单元,类似于分层抽样,这样抽取出的样本分布均匀;或者随机排序;要尽量缩小各个等距组内的方差,增大等距组间的方差,否则抽出的样本有偏(每一组内都服从同样的规律)。 5、PPS抽样:概率比例抽样,是一种多阶段抽样,每一阶段都可视为整群抽样,每一个抽中的群继续被整群抽样,直到抽样的单元满足要求,成为基本的调查单元。PPS抽样的优点是每个群被抽中的概率与其规模成正比,规模大的抽样概率大,但是最终会实现每个个体具有相同抽样概率,保证估计的无偏性。 二、非随机抽样法(没有样本框) 1、目的抽样 由研究者根据自己的主观判断选择代表性个案。 2、偶遇抽样   常见于市场调查,街访。 3、定额抽样 根据总体的某些特征分组,然后用目的抽样或偶遇抽样来选择。代表性高于前两种方法。 非随机抽样优点在于简便,代价小,故常用于探索性或试点研究。缺点是不能推断总体。 第三节 抽样分布 一、抽样分布的概念 抽取到不同的样本,会导致样本统计量的不同取值。所以要抽取大量样本,计算出各个样本统计量出现的可能性,得到各个样本统计量的概率分布,才能判断和比较哪个样本量比较合适。 样本统计量的抽样分布:由n个样本的各观察值计算出的统计量的概率分布。 例1:从某个班100位学生中抽取4位学生,计算身高(μ=169,=6.4),来估计全班平均身高,假设抽取了成千上万个样本,得到了如下结果: 抽样分布 计算的期望值 计算的标准差(标准误差) P() P() (-169)2 (-169)2 P() 161 0.01 1.61 64 0.64 163 0.05 8.15 36 1.80 165 0.12 19.80 16 1.92 167 0.19 31.73 4 0.76 169 0.26 43.94 0 0.00 171 0.19 32.49 4 0.76 173 0.12 20.76 16 1.92 175 0.05 8.75 36 1.80 177 0.01 1.77 64 0.64 1.00 的期望值=169 的方差=10.24 P的标准误差=3.20 为了区分X的标准差和的标准差,的标准差通常称为标准误差(SE)。 可以发现,样本均值抽样分布成正态分布,有时大于有时小于总体均值,平均来看趋于μ。的期望值正好等于估计目标μ。总体标准差是的标准误差SE的2倍。为什么样本均值的波动小于观察值X的

您可能关注的文档

文档评论(0)

baoyue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档