抽样设计Sampling
第6讲 抽样设计Sampling 本讲内容 6.1抽样基本概念及一般过程 6.2概率抽样 6.3 非概率抽样 6.4 样本容量的确定 6.1 抽样基本概念及一般过程 抽样逻辑模型——纽曼(2007)p275 概率抽样基本概念: 抽样元素(sampling element)就是资料收集的单位。可以是个人、群体、组织、书面文件和符号信息、社会行为。 总体(population)所要研究的元素的集合。 所谓定义总体就是指研究者对将被抽样的单位、地理位置和总体在时间上的界限进行界定。 例如:2007年3月,湖北省员工数在100以下的企业。 抽样框(sampling frame):总体要素的列表或者准列表。电话簿、户籍记录、税收记录、产业名录。抽样框和总体之间不吻合是偏差的一个来源之一。 随机(random):任何元素都具有同等的、独立于任何其他事件的、被抽到的概率。 抽样误差(sampling error):直观的说,就是由于随机而造成的样本统计量与总体参数之间的偏差。两个影响因素:样本规模、样本元素之间的异质性。 界定总体 制定抽样框 决定抽样方案:抽样方式的选择、主要目标变量的精度确定、样本规模的确定 实施抽样 样本质量评估 6. 2 概率抽样(probability sampling) 简单随机抽样 系统抽样 分层抽样 整群抽样 多阶段抽样 概率与规模成比例抽样(PPS) 户内抽样 1)简单随机抽样(simple random sampling) 就是等概率抽样,每个个体以相同的概率被抽中。这也可以分为重复抽样和不重复抽样两种形式。 步骤:1)发展一个准确的抽样框; 2)把抽样框中的所有元素编号; 3)利用随机数表选择元素 随机数表使用方法 10819 85717 64540 95692 44985 28459 13687 50699 62110 49307 19105 52686 51336 53101 81842 35376 72734 13951 27528 36140 93818 84972 66048 83361 56465 35859 82675 87301 71211 78007 66241 89679 04843 96407 01970 ------------------------------------------------- (2)等距离抽样(interval sampling) 也称之为系统抽样(systematic sampling) 步骤: 1)首先将总体中的个体按照某种顺序排列起来,编号。 2)按照某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个元素,直到抽满n个元素形成一个样本为止。 值得注意的问题:如果样本的元素是按照某种循环或模式组织起来的。则会出现周期性问题。 周期循环问题 (3)分层抽样(stratified sampling) 步骤: 1) 首先根据相关变量将总体划分为若干不同的层(群、次级总体) 2)然后按照相对比例,从各个层中抽取适当数量的元素组成样本。 注意: 1)用于划分总体的变量(分层变量)除了考虑常见的人口统计特征变量、比较容易得以辨识的变量外,还要考虑与研究变量相关的一些变量。例如性别和许多研究变量相关,且容易辨识,所以常常作为分层变量。 2)分层抽样的时候应该是各个层内之间的元素的差异比较小,而使层之间的元素比较大。各个层的划分要根据研究者的判断和研究目的。 3)当研究者感兴趣的层占总体的比例很小的时候,若采用简单随机抽样方法就可能会漏掉该层的元素,此时常用分层抽样。 4)在某些特殊情况下,研究者可能想让某个层在样本中的比例不同于其在总体中的真正比例,此时也常用分层抽样。 5)在3)与4)情境下,做推断的时候,要进行处理。 (4)整群抽样(cluster sampling) 两种情境下要考虑采用整群抽样: 没有最终要素名册,也就是没有有关最终要素的抽样框; 总体分散,取得样本的成本极其高昂。 步骤: 1)就是首先将总体划分为若干个小子群,这些子群包含有最终抽样元素,或者经过多层后包含有最终抽样元素。 2)然后以这些群为抽样单位,按照简单随机抽样法或者系统抽样法从中抽出部分子群, 3)抽取出的子群的所有元素都构成样本元素。 例如:城市人口抽样 注意: 整群抽样比简单随机抽样花费较少,但是更不精确。 一般来说,整群抽样的设计原则是:尽可能设计较多的群,和抽取较多的群,而减少每个群的抽样元素数量。人口调查常常是
原创力文档

文档评论(0)