- 1、本文档共37页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章___抽样与抽样估计
第五章 抽样与抽样估计
5.1 抽样调查中的基本概念
5.2 常用的抽样分布
5.3 抽样估计的基本方法
5.4 其他抽样组织方式及其抽样估计
5.1 抽样调查中的基本概念
总体(population)与样本(sample)
1. 总体与参数
总体是根据一定统计目的所确定的同类事物的全体,是所要说明其数量特征的研究统计研究对象(objects)。构成总体的每个个别事物(或基本单元element)称为一个总体单位,也称个体(individual)。
一个总体中包含的总体单位的个数,称为总体的容量,一般用N表示。存在有限总体和无限总体之分。
说出以下问题的总体和总体单位:
(1)研究某部门职工收入的水平?
(2)对某厂某月生产的电视机进行质量检查?
(3)研究某地区农村居民家庭的生活水平?
(4)研究“十五大”以来宁波市居民家庭生活条件发生的变化?
(5)测定一个物件的精确重量?检查某种新型纱线的拉力强度?
总体某一方面数量特征(称为总体的一个指标)的数值虽然是客观存在的确定的常数,但又是未知的,因此也称为总体参数(parameter)。
比如:职工总体可以从不同的方面进行认识,总平均工资,工资的总标准差,不同学历层次的工资水平及其差异程度,所占的比例,工资总量等。
总体的数量特征是对个体的数量特征或属性特征进行计数、加总或运算的结果。如总量、平均量、比例数、方差或标准差等是常用的总体参数。
2. 样本与统计量
总体的一部分,或者从总体中抽取的部分单位所构成的整体,称为总体的一个样本(sample)。样本中包含的总体单位数称为样本容量,常用n表示。
有大样本和小样本之说。样本是不确定的。
根据样本资料确定的数量指标,称为统计量(statistic),或者说统计量是样本资料的函数(不含有未知数)。
概率抽样和非概率抽样
概率抽样(probability sampling)也叫随机抽样(random sampling), 即抽样时遵循随机原则。基本的组织方式有:简单随机抽样、分层(stratified)随机抽样、系统(systematic)随机抽样、整群(cluster)随机抽样。
避免系统误差,统计推断时可以计算和控制抽样误差。
非概率抽样:根据经验或需要,主观选取若干总体单位构成样本。
抽样误差
统计调查误差:调查结果与真实值间的差异。按来源有登记性误差和代表性误差之分。
登记误差:观察、登记、测量、计算等引起。可存在于一切调查中。
代表性误差:用样本资料对总体特征进行推断时所引起的。有系统误差(非随机因素引起)和随机误差(随机因素引起)之分。
随机误差是抽样调查所特有的。抽样估计中的抽样误差就是指由于抽样的随机性而产生的估计量与被估计的总体参数之间的代表性误差。
由于总体参数的未知性,某次具体抽样结果的实际抽样误差是无法计算的。
但由于对确定的总体和确定的抽样方案,估计量的取值存在一定的分布规律,因此可以从所有可能的样本来考察抽样误差。抽样平均误差则是反映确定的抽样方案下所有可能抽样实际误差绝对值的一般水平的统计指标。
对于无偏估计量,抽样平均误差定义为估计量的标准差。他是可以计算的。
在一定的概率保证程度下,抽样实际误差的可能取值的允许范围(称为抽样极限误差)也是可以计算和控制的。
抽样误差率(极限误差/估计量)与抽样精度的概念。
5.2 常用的抽样分布
1. χ2 分布
2. t分布
3. F分布
4. 正态分布的有关性质
5. 样本比例数的抽样分布
总体中具有某种特征的个体数占总体单位总数的比例称作总体比例,记作P。
样本中具有某种特征的单位占全部样本单位的比例称作样本比例,记作p。
如:民众对某项政策的支持率为P。随机选择n个人询问他们是否支持某政策,结果有m个回答支持,则p=m/n为样本支持率。
采用重复抽样时,m~B(n,P), E(m)=nP, D(m)=nP(1-P)。因此E(p)=P, D(p)=P(1-P)/n。
如果采用不重复抽样, 则m~HG(n, NP,N),E(m)=nP, D(m)=nP(1-P)(N-n)/(N-1)。因此E(p)=P, D(p)=P(1-P)/n (N-n)/(N-1)。
6. 影响抽样误差的主要因素
抽样平均误差 重复抽样 不重复抽样
样本平均数
样本比例数
主要因素:
总体方差或标准差;
样本容量;
抽样方法或抽样组织方式。
证明:
5.3 抽样估计的基本方法
一、点估计
定义:点估计(point estimate)也叫定值估计,直接以一个样本估计量的观察值作为参数的估计值。
常用方法:矩估计法, 极大似然估计法。
评价标准:对总体的数量特征可以提出若干估计量。所谓估计量的评价标准指的是衡量一个统计量用以估计总体
文档评论(0)