- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 抽样调查基本原理
PAGE
PAGE 24
第四章 抽样与抽样估计
(一)教学目的
通过本章的学习,掌握抽样基本理论及参数的估计方法,学会对总体参数进行区间估计。
(二)基本要求
要求掌握抽样调查中的基本概念、抽样估计的基本方法,学会样本统计量的计算方法,并能对总体参数进行估计。
(三)教学要点
1、不同抽样组织形式的抽样误差计算;
2、总体均值及比例的区间估计;
3、必要抽样数目的计算方法。
(四)教学时数
6课时
(五)教学内容
本章共分四节
第一节 有关基本概念
一、总体
总体也叫母体,它是所要认识对象的全体,是具有同一性质的许多单位的集合。组成总体的每个个体叫做单位。
总体可以是有限的,也可以是无限的。如果总体中所包含个体的数目为有限多个,则该总体就是有限总体,反之是无限总体。总体也可区分成计量总体(由测量值组成的)和计数总体(由品质特征组成的)。
在抽样以前,必须根据实际情况把总体划分成若干个互不重叠并且能组合成总体的部分,每个部分称为一个抽样单元,不论总体是否有限,总体中的抽样单元数一定是有限的,而且是已知的,因此说抽样调查的总体总是有限的。抽样单元又有大小之分,一个大的抽样单元可以分成若干个小的抽样单元,最小的抽样单元就是每一个个体。如一项全国性的调查,如果把省作为一级单元,则可以把县作为二级单元,乡作为三级单元,村作为四级单元等等。又如在流动人口抽样中,可以以居委会作为抽样单元,而在家计调查中,则以户为抽样单元。
总体应具备同质性、大量性和差异性的特征。在抽样调查中,通常将反映总体数量特征的综合指标称为总体参数。常见的总体参数主要有:
总体总和Y:
总体均值:
总体比率R:是总体中两个不同指标的总和或均值的比值。
总体比例P:是总体中具有某种特性的单元数目所占比重。
二、样本
样本是由从总体中所抽选出来的若干个抽样单元组成的集合体。抽样前,样本是一个n维随机变量,属样本空间;抽样后,样本是一个n元数组,是样本空间的一个点。
样本是总体的缩影,是总体的代表。抽样的效果好不好,依赖于样本对总体是否有充分的代表性。样本的代表性愈强,用样本指标对总体全面特征的推断就愈精确,即推断的误差就愈小;反之,如果样本的代表性愈弱,推断的误差就愈大,推断结果就愈不可靠。
如何增强样本的代表性,使其能达到估计或推断的预期效果,就必须分析影响样本代表性的因素,以便加强控制。一般情况下,影响样本代表性的因素有以下几个方面:
(1)总体的差异程度。若总体的分布很集中,即平均离散程度(标准差)很小,从中任抽部分单元做样本,样本特征很近似于总体特征,样本的代表性就强;反之,如果总体的分布很分散,即平均离散程度很大,从中抽取样本单元的随机波动也很大,必将影响样本的代表性。
(2)抽样单元数的多少(或称样本容量的大小)。抽样单元数的多少,影响样本对总体的代表性。一般说来,样本容量以大为好,但要根据实际情况,以掌握适度为宜,要在保证一定可靠程度的情况下,尽可能满足及时性和经济性的要求,取得好的效益。
(3)抽样方法。抽样方法一般分为放回抽样和不放回抽样。放回抽样也叫重置抽样,或重复抽样。它是在总体N个单元中随机抽取n个单元时,每次抽取一个单元进行记录后又放回原来的总体,参加下一个单元的抽取,即下一个单元仍然在原来的全部抽样单元中抽取,依此类推,直到抽足所需单元数为止,因而同一个抽样单元有被重复抽中的可能。不放回抽样也叫不重置抽样,或不重复抽样。它是在每次抽取一个新的单元之前,将已抽中的单元不再放回原来的总体,下一个单元的抽取在剩余的抽样单元中进行,依次类推,直到抽足所需单元数为止,因而每个抽样单元最多只能被抽中一次,不可能重复被抽中。
放回抽样与不放回抽样相比,不放回抽样的样本代表性优于放回抽样。因为放回抽样中,有些单位有被重复抽取的可能,从而使样本单元数在总体中的散布面缩小,样本的代表性减弱,故在实际工作中常采用不放回抽样。有鉴于此,在本书以后内容中,如没有特别的声明,则一般只涉及不放回抽样。理解了不放回抽样的方法及有关内容,也就容易理解和掌握放回抽样的方法。
以上三种影响因素中,第一个因素即离散程度的大小,是由事物内部和外部联系决定的,是客观性的因素,人们只能认识了解,不能调节控制。第二、三两因素是人们可以选择和控制的,为主观因素,只要掌握和控制了这两个因素,在一定程度上,人们也就能控制样本的代表性,以期达到抽样数目尽可能小,使估计和推断结论达到预定的精确程度和可靠程度的要求。另外,等概率抽样与不等概率抽样相比,以不等概率抽样的样本代表性较等概率抽样为好。
一般将反映样本数量特征的综合指标称之为统计量。统计量是n元样本的一个实值函数,是一个随机变量,统计量的一个具体取值即为统计值。主要的样本统计量有:
样本总和y:
样本均值:
样本比率r:
样本比例p
文档评论(0)