抽样设计讲稿.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
抽样设计讲稿

抽样设计 Sampling 1 抽样基本概念及一般过程 如果我们由总体内随机抽取许多独立的样本,这些随 机抽样所得到的统计结果将以一种可知的方式分布在 总体参数附近. 那么抽样结果集中在总体参数多大的范围内呢?— 置信水平和置信区间 概率理论明确指出: 一定比例的样本估计值会落在总体参数值的某个增量内(一个标准误SE就是一个增加单位)---置信区间 (2)置信区间(Confidence Interval) 是指在一定范围的置信水平下,样本统计值与总体参数值之间的误差范围 估测总体参数值的范围.它是指在一定的置信度下,样本 值与总体值之间的误差范围。它反映的是抽样的精确程度。 范围越大,精确性程度越低。 在其他条件一定的情况下,置信区间越小,精确性程度要 求就越高,即样本值与总体值之间的误差范围越小,则所要 求的样本规模就越大。 举例: 我们有95%的信心说,35-45%的投票者会投票给A 由于平均数的抽样分布是正态分布,其平均数的次数 就是正态曲线下的面积.而根据概率统计论,正态分布 曲线下的面积是可以用数学方法推算的. 有90%落在u±1.65SE之间 有95%落在u±1.96SE之间 有98%落在u±2.33SE之间 有99%落在u±2.58SE之间 我们可以这样说:对于任何一次抽样来说,其样本统 计值落在总体参数值正负2个标准误之间的概率是 95% 二、抽样的基本程序 1.界定总体 2.选择抽样的具体方法,确定抽样的精确性程度与样本规模 3.制定抽样框 4.实施抽样 5.样本质量评估 2 概率抽样 (probability sampling) 简单随机抽样 系统抽样 分层抽样 整群抽样 多阶段抽样 概率与规模成比例抽样(PPS) 户内抽样 1)简单随机抽样 (simple random sampling) 就是等概率抽样,每个个体以相同的概率被抽中。 步骤:1)发展一个准确的抽样框; 2)把抽样框中的所有元素编号; 3)利用数学软件(随机数表等)选择元素 例如: 调查在校学生的阅读倾向 将符合要求的学生做统计后(除去留学生,成教等)总数为2万多人,考虑要作年级和教育差异对比,可将学生分为本科、硕士、博士三个大群体,需要抽取1068人就足够了。经求取比例,最低比例4.3%可以满足样本需求。 2、不按比例分层抽样 当总体中有些分层的数目太少,若以比例抽样,则有的层在样本中个案太少,影响分析。为了对不同层次的子总体进行专门研究,则可不按比例分层抽样。 但需注意,若要用样本资料推断总体时,则需要对各层数据资料进行加权处理,使样本中各层的比例恢复到总体中各层实际的比例结构。 例如:某厂600工人(男500,女100人)调查他们的平均收入。计划抽样60人。 按比例抽样: 男500*(60/600)=50人,女100*(60/600)=10人 不按比例抽样,即男女各抽30人 全厂工人平均收入=(每个男工的收入*5/3+每个女工的收入*1/3)/60人 3.二相分层抽样 1938年Neyman提出的 先取一个大样本额的样本,调查每一个单位的 辅助变量,然后按辅助变量将此样本的各单位 分入不同的层,再从中做一个小样本的分层抽 样 注意: 1)用于划分总体的变量(分层变量)除了考虑常见的人口统计特征变量、比较容易得以辨识的变量外,还要考虑与研究变量相关的一些变量。例如性别和许多研究变量相关,且容易辨识,所以常常作为分层变量。 2)分层抽样的时候应该是各个层内之间的元素的差异比较小,而使层之间的元素比较大。各个层的划分要根据研究者的判断和研究目的。 3)当研究者感兴趣的层占总体的比例很小的时候,若采用简单随机抽样方法就可能会漏掉该层的元素,此时常用分层抽样。 4)在某些特殊情况下,研究者可能想让某个层在样本中的比例不同于其在总体中的真正比例,此时也常用分层抽样。 5)在3)与4)情境下,做推断的时候,要进行处理。 (4)整群抽样(cluster sampling) 两种情境下要考虑采用整群抽样: 没有最终要素名册,也就是没有有关最终要素的抽样框; 总体分散,取得样本的成本极其高昂。 步骤: 1)就是首先将总体划分为若干个小子群,这些子群包含有最终抽样元素,或者经过多层后包含有最终抽样元素。 2)然后以这些群为抽样单位,按照简单随机抽样法或者系统抽样法从中抽出部分子群, 3)抽取出的子群的所有元素都构成样本元素。 例如:城市人口抽样 注意: 整群抽样比简单随机抽样花费较少,但是更不精确。 一般来说,整群抽样的设计原则是:尽可能设计较多的群,和抽取较多的群,而减少每个群的抽样

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档