《抽样与抽样分布》1-3节课堂知识汇总及典型例题.docVIP

下载本文档

113
0
约4.64千字
约 6页
2019-03-27 发布于河北
举报
版权申诉

《抽样与抽样分布》1-3节课堂知识汇总及典型例题.doc

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

PAGE \* MERGEFORMAT 8 第五章抽样与抽样分布第一节抽样的基本概念一、几个基本概念 1、目标总体和抽样总体目标总体就是研究对象的全体。抽样总体是指从中抽取样本的总体。二者理应一致，但实际中有时难以保证。 2、抽样单元和抽样框抽样总体的具体表现就是抽样框，通常是一份包含所有抽样单元的名单，好的抽样框应该尽可能多地提供与研究目标有关的辅助信息。抽样单元是构成抽样框的基本单位，可以是一个个体，也可以包含若干个个体，还可以分级。分级情况下，总体由若干个较大规模的抽样单元组成，为初级单元，每个初级单元又包含若干个规模较小的单元，为二级单元，以此类推。抽取哪一级，就需要有哪一级的抽样框。 3、抽样误差和非抽样误差抽样误差是抽取样本的随机性造成的样本值和总体值之间的差异。只要采用抽样调查，抽样误差就不可避免，但可通过增大样本量来减小误差。非抽样误差是由于其他多种原因引起的样本值和总体值之间的差异。三、抽样方案设计 1、抽样设计步骤：明确调查目的，确定研究对象，确定目标量；明确总体及抽样单元；（根据总体的定义，收集一份全部个案的名单）对主要目标量的精度提出要求（误差控制在多大范围内）；选择抽样方法；根据抽样方法、精度要求等确定样本量，并估计抽样误差；制定具体步骤。 2、设计原则（1）随机性原则——总体中所有个体被抽中机会相等。（2）抽样效果最佳原则——在固定费用下，抽样误差最小；在要求精度下，费用最少。第二节抽样方法一、随机抽样 1、简单随机抽样：最基本的抽样方法，最符合随机原则，每个个体都有同样的被抽中概率。是其它复杂抽样设计的基础。使用随机数表。 2、分层抽样：将总体按照某些特征分成若干个层，在每一层当中独立抽取若干子样本。要求组内同质性强，组间差异大。由于在每层中都抽取出一些样本，样本具有较好的均匀性，代表性更强。 3、整群抽样：先将总体划分为若干群，然后以群为初级抽样单元，从中随即抽取n个群，对抽中的裙内的所有次级单元都进行调查。要求群内差异大，群间差异小。组织上方便，但抽样单元过于集中，抽样误差最大。 4、系统抽样：按照某种顺序给总体中的N个单元编号，然后随机抽取一个编号作为样本的第一个单元，其它单元则按照某种确定的规则抽取。最常见的是等距抽样，按照相等的距离抽取样本。尽可能按照与调查项目有关的变量的大小顺序进行排序总体单元，类似于分层抽样，这样抽取出的样本分布均匀；或者随机排序；要尽量缩小各个等距组内的方差，增大等距组间的方差，否则抽出的样本有偏（每一组内都服从同样的规律）。 5、PPS抽样：概率比例抽样，是一种多阶段抽样，每一阶段都可视为整群抽样，每一个抽中的群继续被整群抽样，直到抽样的单元满足要求，成为基本的调查单元。PPS抽样的优点是每个群被抽中的概率与其规模成正比，规模大的抽样概率大，但是最终会实现每个个体具有相同抽样概率，保证估计的无偏性。二、非随机抽样法（没有样本框） 1、目的抽样由研究者根据自己的主观判断选择代表性个案。 2、偶遇抽样　　常见于市场调查，街访。 3、定额抽样根据总体的某些特征分组，然后用目的抽样或偶遇抽样来选择。代表性高于前两种方法。非随机抽样优点在于简便，代价小，故常用于探索性或试点研究。缺点是不能推断总体。第三节抽样分布一、抽样分布的概念抽取到不同的样本，会导致样本统计量的不同取值。所以要抽取大量样本，计算出各个样本统计量出现的可能性，得到各个样本统计量的概率分布，才能判断和比较哪个样本量比较合适。样本统计量的抽样分布：由n个样本的各观察值计算出的统计量的概率分布。例1：从某个班100位学生中抽取4位学生，计算身高（μ=169，=6.4），来估计全班平均身高，假设抽取了成千上万个样本，得到了如下结果：抽样分布计算的期望值计算的标准差（标准误差） P() P() (-169)2 (-169)2 P() 161 0.01 1.61 64 0.64 163 0.05 8.15 36 1.80 165 0.12 19.80 16 1.92 167 0.19 31.73 4 0.76 169 0.26 43.94 0 0.00 171 0.19 32.49 4 0.76 173 0.12 20.76 16 1.92 175 0.05 8.75 36 1.80 177 0.01 1.77 64 0.64 1.00 的期望值=169 的方差=10.24 P的标准误差=3.20 为了区分X的标准差和的标准差，的标准差通常称为标准误差(SE)。可以发现，样本均值抽样分布成正态分布，有时大于有时小于总体均值，平均来看趋于μ。的期望值正好等于估计目标μ。总体标准差是的标准误差SE的2倍。为什么样本均值的波动小于观察值X的