第二章 抽样调基本原理.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 抽样调基本原理

第二章 抽样调查基本原理 第一节 有关基本概念 第二节 样本统计量的抽样分布 第三节 抽样误差 第四节 抽样估计 第一节 有关基本概念 一、总体 总体也叫母体,它是所要认识对象的全体,是具有同一性质的许多单位的集合。组成总体的每个个体叫做单位。 在抽样以前,必须根据实际情况把总体划分成若干个互不重叠并且能组合成总体的部分,每个部分称为一个抽样单元,不论总体是否有限,总体中的抽样单元数一定是有限的,而且是已知的,因此说抽样调查的总体总是有限的。 总体应具备同质性、大量性和差异性的特征。在抽样调查中,通常将反映总体数量特征的综合指标称为总体参数。常见的总体参数主要有: 总体总和Y 总体均值 总体比率R 总体比例P 二、样本 样本是由从总体中所抽选出来的若干个抽样单元组成的集合体。抽样前,样本是一个n维随机变量,属样本空间;抽样后,样本是一个n元数组,是样本空间的一个点。 影响样本代表性的因素有以下几个方面: (1)总体标志值分布的离散程度。 (2)抽样单元数的多少(或称样本容量的大小)。 (3)抽样方法。 一般将反映样本数量特征的综合指标称之为统计量。统计量是n元样本的一个实值函数,是一个随机变量,统计量的一个具体取值即为统计值。主要的样本统计量有: 样本总和y 样本均值 样本比率r 样本比例p 三、必要样本容量和样本可能数目 样本中包含的抽样单元个数称为样本容量,又称样本含量或样本大小 。 样本可能数目则是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数。用A表示。 当N和n一定时,A的多少与抽样方法有关,其计算方法列表如下: 四、抽样框 抽样框是在抽样前,为便于抽样工作的组织,在可能条件下编制的用来进行抽样的、记录或表明总体所有抽样单元的框架,在抽样框中,每个抽样单元都被编上号码。 编制抽样框是一个实际的、重要的问题,因此必须要认真对待。 抽样框可以是一份清单(名单抽样框)、一张地图(区域抽样框)。 常见的抽样框问题可以概括为四种基本类型: (1)缺失一些元素,即抽样框涵盖不完全; (2)多个元素对应一个号码; (3)空白(一些号码没有与之对应的元素)或存在异类元素; (4)重复号码,即一个元素对应多个号码。 第二节 样本统计量的抽样分布 一、正态分布 如果总体各个体的标志值以总体平均数为中心,形成钟型对称分布,其分布曲线向两侧扩展,逐渐向横轴逼近,无限延伸出去,但不接触横轴,则这种分布就叫做正态分布,或高斯分布、常态分布。服从正态分布的总体称为正态总体。 如果一个随机变量X服从正态分布,则其分布的密度函数(分布曲线方程)为: 任何正态分布,它的样本落在任意区间(a,b)内的概率等于直线x=a,x=b,横坐标和曲线f(x)所夹的面积(可由正态分布概率积分表查得)。经计算,正态总体的样本落在: (-σ, +σ)概率是68.27%; (-2σ, +2σ)概率是95.45%; (-3σ, +3σ)概率是99.73%; (-1.96σ, +1.96σ)概率是95%; 二、抽样分布 抽样分布是根据所有可能样本计算出来的某一统计量的数值分布。 抽样分布有极限分布和精确分布两类。极限分布也叫做大样本分布,它只有正态分布一种形式;精确分布又叫做小样本分布,其前提是总体服从正态分布,它是正态分布的导出分布,包括有t分布、F分布和 分布等形式。 例:总体N=5,Y={40,50,60,70,80},则其次数分布图为 * * 不考虑顺序 考虑顺序 不放回抽样 放回抽样 抽样方法 返回 当μ=0,σ2=1时,称该分布为标准正态分布。标准正态分布的密度函数为 , χ2 一般地,可以证明如果总体服从正态分布,且总体均值和 方差均为已知,即 Y~N(μ,σ2) 则不论样本量大小如何,样本均值均围绕总体均值而服从 正态分布,并且其抽样分布的方差等于总体方差的n分之 一,即 ~N(μ,σ2/n) 而对于非正态总体,若均值μ和σ2有限,则根据中心极限 定理,当样本量n充分大时,样本均值仍然围绕着总体均值 而近似地服从正态分布,即 ~N(μ,σ2/n) (一)样本统计量的极限分布 若取n=2,用放回抽样, 可抽25个简单随机样本, 整理后,即可得出关于样本均值 的次数分布情况为: 1 2 3 4 5 4 3 2 1 f 40 45 50 55 60 65 70 75 80 用图形表示,则为: 如果总体容量较大,则当样本容量逐步扩大时,样本平均数 的分布趋于正态分布的趋势更加明显。 (二)样本统计量的精确分布 1、χ2分布 设随机变量Yi~N(0,1)(i=1,2,…,n),

文档评论(0)

woai118doc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档