- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第1部分 抽样设计
第1节 概述
(2)样本分布:样本中观察值所形成的分布
(3)抽样分布:样本统计量的抽样分布
(4)样本均值的抽样分布与总体分布之间的关系:
三、概率抽样与非概率抽样
1.概率抽样:
(1)定义:按照随机原则抽取样本,也称随机抽样。也就是在抽取样本时,排除主观上有意识的挑选,总体中每个单元都有一定的机会被抽中。
(2)分类:等概率抽样和不等概率抽样
(3)特点:可以用样本数据对总体参数进行估计,但操作相对复杂。
2.非概率抽样
(1)定义:根据有关判断有意识的挑选,或者根据方便、快捷的原则抽取。
(2)特点:操作简便,时效快,效率低,但理论上不具备对总体进行推断的依据。
第2节 概率抽样方式
一、简单随机抽样。
1.定义:从总体N个单元中,随机抽取n个单元构成样本
2.放回和不放回简单随机抽样
3.随机化程序实现方法
(1)抽签法
(2)随机数表法
(3)计算机抽取
(4)永久随机数法
4.特点:单元入样概率相同,操作计算简单。
二、分层抽样
1.定义:将总体按照一定的原则分成若干子总体,每个子总体称作层,在每个层内分别抽取样本。
2.原理:先对层进行估计,然后加权汇总。
3.分层原则:层内差异小,层间差异大。
4.特点
(1)能提高估计效率
(2)同时对总体和子总体进行估计
三、整群抽样
1.定义:将总体按照一定原则分成若干群,抽样直接抽取群,对抽中的群进行全面调查。
2.分群原则:群内差异大,群间差异小。
3.特点
(1)实施方便,可节约费用和时间
(2)不需要总体所有单元的名单
(3)如果群内差异小,群间差异大,则估计精度差
四、系统抽样
1.定义:将总体按照某种顺序排列,在规定的范围内随机抽取起始单位,然后按照一定规则确定其他样本单位。(最简单的方法:等距抽样)
2.特点
(1)操作简便;
(2)当时,样本均值为有偏估计量;
(3)方差估计复杂。
3.注意问题:周期性变化的总体
五、多阶段抽样
1.定义:首先从总体中采用随机方法抽取若干个小总体(初级单元),再在抽中的初级单元中随机抽取若干个单元,这种抽样方法称作二阶段抽样。
2.大范围调查中通常采用二阶段抽样的原因
(1)缺少包括所有总体单位的抽样框;
(2)可以节省调查的人财物力。
六、其他抽样方法
1.多重抽样(二重抽样、双相抽样)
2.不等概率抽样(抽样、抽样)
3.双重抽样框抽样
第3节 非概率抽样方式
第4节 抽样中的误差问题
,在概率抽样条件下,用样本数据计算出一个统计量作为总体参数的估计,把称作的一个估计量。
(2)估计量方差:
(3)作用:描述估计精度。
2.偏差
(1)定义:如果反复进行抽样,其所有可能样本估计量的均值(数学期望)与总体参数的之间的离差,即。
(2)偏差与估计量方差的区别
偏差是系统性误差,而估计量方差是随机误差,没有系统性;
估计量方差随着样本量的增大而减小,而大多数偏差(少数有偏估计量除外)并不随着样本量的增大而减小。
(3)结论
对于无偏估计量
采用有偏估计量,无论怎样提高样本量,都不能提高估计精度。
3.均方误差
(1)定义:估计量方差和偏差的平方之和。
(2)对于无偏估计量:
二、抽样误差
1.定义:由于抽样的随机性产生的,用样本统计量估计总体参数时产生的误差。
2.描述方法:(估计量的标准差,也称抽样标准差)
3.影响抽样误差的因素
(1)总体的分布状况;
(2)样本量;
(3)抽样方式和估计方法。
4.特点:可以计算并控制,但不能消除。
5.控制方法
(1)选择适当的抽样方法;
(2)确定充分的样本量;
(3)加强对抽样调查组织的领导,提高抽样调查工作质量。
三、非抽样误差
1.定义:由于抽样框中的单元放回或者遗漏、部分调查对象不回答或者原始数据不准确等原因造成的误差,主要包括抽样框误差、无回答误差、调查员误差、受访者误差等。
2.抽样框误差:调查总体与目标总体不完全吻合(涵盖不全和过涵盖)。
3.无回答误差
(1)单位无回答:若无回答率过高,需要补调查;
(2)项目无回答:需插补。
4.调查员误差(解释误差)
5.受访者误差(理解、记忆误差或者有意隐瞒)
6.其他:测量工具误差、数据编码和录入错误等。
五、误差问题小结
1.从性质上看:估计量方差、偏差、均访误差。
2.从类型上看:抽样误差和非抽样误差。
第5节 参数估计方法
一、参数估计方法
1.参数估计:用样本统计量去总体参数。
2.估计量:用来估计总体参数的统计量的名称,称为估计量。
3.方法分类
(1)点估计:用样本估计量的值直接作为总体参数的估计值,称为点估计
(2)区间估计:在点估计的基础上,给出总体参数估计的一个范围,称作区间估计。
4.评价估计量的标准:无偏性、有效性、一致性。
二、总体均值的区间估计
1.点估计:用样本均值估计总体均
文档评论(0)