八抽样方法.pptxVIP

  • 84
  • 0
  • 约4.38千字
  • 约 27页
  • 2018-06-03 发布于上海
  • 举报
八抽样方法

1 探讨一些问题: 1.样本大小问题; 2.抽样误差问题; 3.无回复情况; 2 3 4 8.3 抽样方法 5 抽样方式的特点 概率抽样的特点 随机性、成本高、要求高、精确度。 非概率抽样的特点 最大特点是操作简便,时效快,成本低。 6 概率抽样方法 1.简单随机抽样(SRS) 为抽出一个简单随机样本,调研人员首先需要编辑一个抽样框,给其中每个个体分配一个号码,然后用计算机程序或随机数表(见附录B-1)生成随机数,根据这些随机数来确定哪些个体被包括进样本中。 简单随机抽样有许多优点: 最简单、最典型的概率抽样技术,易于理解; 抽样框不需要其他(辅助)信息就能进行抽样; 样本结果可以推论到目标总体上,大多数统计推论方法都假定数据是由简单随机抽样方法收集的。 7 概率抽样方法 2.系统抽样(SYS) 指将调查总体单位按照一定标志进行顺序排列,然后根据总体单位数和样本单位数计算出抽样间距(k),并从抽样框中每隔k个单位抽选一个个体,组成样本。 抽样间距(k)=总体单位数(N)/样本单位数(n) 例1:总体中有50000个单位,想要抽取一个样本量为500的样本,此时抽样间距k为100.在1~100之间选出一个随机数如36,则该样本就由个体36、136、236、336、436……49736、49836、49936等500个样本组成。 8 概率抽样方法 总体单位的排序决定着系统抽样的代表性,并决定系统抽样调查结果的统计效率。 分三种情况说明: 1.如果排序与要研究的特征无关,则结果与SRS相似; 2.当排序与要研究的特征有关时,SYS能增加样本的代表性。 3.若排序呈现循环形式,抽样间距又与循环周期相同时,系统抽样会降低样本的代表性。 9 概率抽样方法 例2:如果在某行业中按照年销售额的增序排列公司,那么一个系统 抽样的样本将包括一些小公司和一些大公司,通常会比一个简单随机样本具有更好的代表性。 例3:想对商场的零售额进行抽样调查,以7天为抽样间隔。因为每周7天中商场的销售额实际是不同的,而且有一定规律,那就是周末和假日零售额比较多,平时比较少。若抽中周末为系统样本的起点,估计结果就会偏高;反之,若抽中平时为样本起点,估计结果则偏低。 10 概率抽样方法 系统抽样的优点: 1.在没有抽样框时,可代替简单随机抽样; 2.与简单随机抽样一样,系统抽样不需要辅助的抽样框信息; 3.与简单随机抽样相比,系统抽样样本的分布较好(这还取决于抽样间隔及抽样框架是如何排列的); 4.与简单随机抽样一样,有较好的理论支持,估计值容易计算; 5.只需要一个随机起点,系统抽样更简单,成本低,更容易实现。 11 系统抽样的缺点: 1.如果间隔正好碰上总体变化的某种周期,就会得到一个差的系统样本; 2.与简单随机相同,由于不使用抽样框中的辅助信息,抽样策略的效率不高; 3.系统抽样的抽样方差没有一个无偏的估计量,为了进行方差估计,必须把系统看做简单随机样本,而且在名录框中的单元确实是随机排列的。 12 概率抽样方法 3.分层抽样(Stratified Sampling) 指将调查总体中的所有单位按照一定的属性或特征分成不相重叠的若干层次(或类),然后在每一个层次(或类)中进行简单随机抽样或等距抽样。 分层标志,一定是总体的某种重要属性或特征,而且与调查主题内容之间联系越密切越好。 分层的目的是使样本单位在各层、各类中分布比较均匀,具有更好的代表性。 分层抽样在操作上分为四种方法:比例分层、纽曼分层、德明分层和多次分层。 13 概率抽样方法 分层抽样: 设n为样本总数,ni为第i层应抽取的样本单位数,N为调查总体单位数,Ni为第i层总体单位数,则分比例为n/N,等比例意味着ni/n=Ni/N。所以第i层应抽取的样本数量: ni=n(Ni/N). 例如:某街道有居民20000户,按经济收入分为三层,分布情况如表所示。假定样本数为200,通过等比例分层进行购买力调查。各层应抽取的样本数量可以按上述公式计算出来,结果如下表: 14 等比例分层抽样法例表 高收入层 中收入层 低收入层 户数 比例 户数 比例 户数 比例 2000 10 12000 60 6000 30 20   120   60   15 概率抽样方法 4.整群抽样(Cluster Sampling) 指首先将调查总体区分为若干群,然后采用SRS方法抽出部分群作样本,最后对这些样本群进行全面调查。即,两段整群抽样。在两段整群抽样中,如果不对所抽样本群进行全面调查,而是进一步将这些群划分为若干小群,然后按照随机原则抽出一部分群进行全面调查,就形成所谓的三段整群抽样。 16 概率抽样方法 整群抽样有以下主要优点: 由于样本相对集中,整群抽样能大大降低数据收集的费用。 当总体单位自然聚合成群时,

文档评论(0)

1亿VIP精品文档

相关文档