- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 抽样设计 20世纪30年代早期,乔治·盖洛普在美国很受欢迎。他成为Drake大学新闻系的系主任,然后转至西北大学。在此期间,他从事美国东北部报刊的读者调查。1932年的夏天,一家新的广告代理商电扬广告公司,邀请他去纽约创立一个旨在评估广告效果的调查部门。并制定一套调查方案。同年,他利用他的民意测验法帮助他的岳母竞选艾奥瓦州议员。盖洛普证实,通过科学抽样。可以准确地估测出总体的指标。同时,在抽样过程中,可节省大量资金。 抽样调查和普查的区别 一、几个基本概念 (一)全及总体(母体)和抽样总体(子体) (二)指标和标志 (三)总体指标和样本指标 (四)重复抽样和不重复抽样 (五)抽样单元 (六)抽样框 (七)大样本和小样本 (八)总体分布和样本分布 抽样框的缺陷 抽样框的缺陷包括不完全覆盖、过量涵盖、重复单元以及错误分类误差。 不完全覆盖是指由于更新数据时出现的时间滞后而使被抽样总体中的某些单元被排除在抽样框之外; 抽样框误差的例子1 狗食品制造商为了增加狗食品的销售额在超级市场对狗的主人进行了广泛的访问调查,他们调查并估计顾客对包装式样和型号的要求,并试探顾客们对广告设计方案的反应。产品投入市场的初期,经历了一个高销售额的阶段。但数月后,销售量却下降了。这家公司讨论研究后,把自己生产的狗食品带到当地的流浪狗收容所,然后把狗食放在狗的面前,但它们却连碰都不碰! 抽样框误差的例子2 1936年《文学摘要》杂志社从电话簿和汽车登记表中选出了一大批选民做抽样调查,它预言Alf London会在竞选中击败Franklin Roosevelt 。不幸的是,这份抽样框选择的选民并不能代表1936年整个美国的选民。因为当时大多数人没有电话,没有汽车。然而,抽样框大部分是富裕阶层,他们都更倾向于投共和党的票。所以在竞选后不久, 《文学摘要》因其失误的预言使其可信度急剧下降,最终导致了破产的结局。 二、两种类型的误差:抽样误差和非抽样误差 调查中有可能出现的两类误差即抽样误差和非抽样误差。 抽样误差是由于仅仅调查总体的一部分,被抽中的那部分总体单元不能精确地代表总体的特征所出现的误差。此类误差仅在抽样调查中出现。 三、概率抽样的种类 概率抽样有七种: 简单随机抽样, 系统抽样, 等比例抽样, 整群抽样, 分层抽样, 多阶抽样, 多相抽样。 在需要根据样本的结果对总体进行推断时应使用概率抽样。 最简单的概率抽样设计是等概率抽样,包括简单随机抽样和系统抽样。 不等概率抽样比较复杂且大多需要辅助抽样框信息。不等概率抽样有:概率与大小成比例的抽样,整群抽样,分层抽样,多阶段抽样和多相抽样。不等概率抽样通常用来提高抽样设计方案的效率,或降低抽样费用。 概率抽样有两条基本准则: 1) 单元是随机抽取的; 2) 调查总体中的每个单元都有一个非零的入样概率,并且能计算出这些概率。 概率抽样的主要优点有: 能得到总体的可靠估计值并能计算每个估计值的抽样误差,因而能对总体进行推断。 概率抽样的主要缺点有: 与非概率抽样相比,概率抽样比较复杂,更费时,通常也更费钱。但总的说来,其利远大于弊。 (一)简单随机抽样 1、概念 2、有限总体的简单随机抽样方法 3、无限总体的简单随机抽样方法 4、优点:方法简单,由于抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。 局限性:编码问题、代表性问题、费用大 (二)等距抽样(系统抽样) 1、概念:是指先将总体各个单位按某一标志值的大小排列,再分成若干个基本相等的组,依据一定的抽样距离来抽取调查单位。 2、抽样距离=总体数/抽样数 3、步骤:编号、计算抽样距离、抽取第一个样本、抽取所有样本。 4、优点:与简单随机抽样相比较,可使中选单位比较均匀地分布在总体中。 5、局限性: (1)要求相关资料详细; (2)当抽选间隔和被调查对象的节奏相重合时,就会影响调查的精度; (3)其抽样误差的计算较为复杂 6、适用范围:当被研究现象的标志变异程度大,而在实际中又不可能抽取更多的样本单位时。 (三)分层抽样(类型抽样) 1、概念 2、步骤:将总体分成几个层,一个总的原则是:各层内的标志值的变异程度要小,层与层之间的变异程度要大。 3、分层抽样的类型 (1)分层比例抽样:按照各个层中单位数量占总体单位数量的多少等比例地分配各个层的样本单位数量。例子 适用范围:适合于各层的标准差大致相近的情况。 (2)分层精确抽样:(最佳分层抽样、牛曼分层法Neyman ) 指在各层内根据变异数大小(标准差)调整各层的样本数量,以提高可信度。
文档评论(0)