- 27
- 0
- 约1.17万字
- 约 63页
- 2016-11-25 发布于广东
- 举报
第三讲抽样调查1.ppt
抽样调查的特点 抽样调查的优点 (1)时间短、收效快 (2)质量高、可信程度好 (3)费用省、易推广 抽样调查的缺点 抽样调查存在着抽样误差 简单随机抽样技术 简单随机抽样:又称单纯随机抽样,是指在抽 样之前对总体单位不进行任何分组、排列等处理,完全按随机原则从总体中抽取样本的抽样方法。?? 常用方法: 抽签法 随机数骰子法 乱数表法(计算机随机数法) 使用统计软件(SAS/SPSS)直接抽取 简单随机抽样的优缺点 简单随机抽样应用实例 总体中每个单位在抽选时具有相等的被抽中机会。 抽样概率公式为:抽样概率=样本单位数/总体单位数 例如,如果总体单位数为10000,样本单位数为400,那么抽样概率为4%,计算过程为: 0.04=400/10000 如果一个抽样框是可以得到的,简单随机抽样方式步骤如下: (1) 对总体的每个单位进行编号,总体单位数为10000的总体可编号为1—10000; (2) 在随机数表中从任意的一个编号数开始向上数或向下数或跳跃数选编号,在00001和10000之间选出400个(样本单位数); (3) 在有明确总体单位的数字表中选出的数字将包括在样本中。 等距离随机抽样 等距离随机抽样:又称机械抽样或系统抽样,先在总体中按一定标志把个体顺序排列,并根据总体单位数和样本单位数计算出抽样距离,然后按相同的距离或间隔抽选样本单位。 常用方法 直线法 圆形系统抽样法 等距离随机抽样操作步骤 (1)对总体编号:将N个总体单位按一定顺序排列; (2)确定抽样间隔:根据总体单位数N和样本单位数n计算出抽样间隔K(必须是整数),K=N/n; (3)确定起始抽号数:在1和K之间随机选一个数字,称为随机起点r; (4)确定别抽取单位:根据r和K从总体中抽取n个样本单位。选中的样本单位号码依次为:r,r+K,r+2K,r+3K,…,r+iK,…,r+(n-1)K。 等距离随机抽样的优缺点 优点: (1)操作简便,省时间,费用低; (2)如果有关设定特征的信息较易得到,则比简单随机抽样样本的代表性更强,且更可靠; (3)不需要抽样框的知识。 缺点: (1)按有关标志排队时,需要有较为详细、具体的相关资料; (2)抽样的效率取决于对总体进行排列时所使用的标志值; (3)抽样误差计算较为复杂。 需要注意的方面 等距随机抽样,能使样本在总体中的分布比较均匀,从而抽样误差减小。但在应用此方法时要特别注意,抽样间隔与现象本身规律之间的关系。 如:对城乡集市贸易商品成交量或成交价格有时间间隔地进行调查,抽样的时间间隔不能用7或30这种与周、月周期一致的数。这种方法最适用于同质性较高的总体,而对于类别比较明显的总体,则采用类型随机抽样法。 分层随机抽样技术 分层随机抽样:又称类型随机抽样,是把调查总 体按其属性不同分为若干层次(类型),然后在 各层中随机抽取样本。 选择分层变量的准则 同质性 异质性 相关性 经济性 等比例分层抽样:按各个层(或各类型)中的单位数量占总体单位数量的比例来分配各层样本数量,据此抽取样本的方法。计算公式: 举例:20000户居民,按经济收入高低分类,高收入居民4000户,占总体20%;中等收入12000户,占总体60%;低收入户4000户,占总体20%,从中抽取200户,进行购买力调查。 等比例分层抽样 高收入层样本数:200×20%=40户 中收入层样本数:200×60%=120户 低收入层样本数:200×20%=40户 分层最佳抽样法 分层最佳抽样法(不等比例抽样法)是指根据其它因素(如各层平均数或成数标准差的大小,抽取样本工作量和费用大小等),调整各层的样本单位数。 按分层标准差大小确定各层样本单位数的计算公式: 分层随机抽样的优缺点 优点: (1)比简单随机抽样和等距离抽样更为精确,能够通过对较少的抽样单位的调查,得到比较准确的推断结果,特别是当总体较大、内部结构复杂时,效果更佳。 (2)在对总体推断时,还能获得对每层的推断结果。 缺点: (1)层的划分需要收集必要的资料,从而耗费额外的费用; (2)要求掌握各层中的单位数目和比例,增加了抽样设计的复杂性,而且也会带来新的误差。 分层抽样的适用性 1.当一个总体内部分层明显时,分层抽样能够克服简单随机样和等距抽样的缺点。 2.分层抽样可以提高总体参数估计的精确度。 3.有些研究不仅要了解总体的情况,而且还要了解某些类别的情况。 4.便于行政管理。同一层可看作一个总体,因此每层可由专人进行管理。 某高一学生共500人,经调查,喜欢数学的学生占全体学生的30%,不喜欢数学的人数占40%,介于两者之间的学生占30%。为了考察学生的其中考试的数学成绩,如何用分
原创力文档

文档评论(0)