- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样和抽样分布 第一节 抽样和抽样方法 一、抽样的一般概念 (一)总体和样本 “总体”是由某些具有共同性质或特征的个体所组成的。总体可分为有限总体和无限总体两类。如果总体所包含的单位数是有限的,则称该总体为有限总体。从总体中抽出的一小部分单位叫做“样本”。研究样本要比研究总体容易得多。从总体中抽取样本的过程就称作抽样。抽样的最终目的是进行统计推断。统计推断就是通过样本的数字特征来推断总体的数量特征, (二)参数和统计量 无论对于总体还是样本都可以使用平均数、中位数、众数与标准差等指标来描述它们的特征。在统计学中,当用它们来描述总体的特征时,称为总体参数。当这些量用来描述样本的特征时,叫做样本统计量。参数是总体的数量特征。对于某个总体来说,其参数是确定的。但通常是未知的通常最关心的就是表示总体分布集中趋势和分散趋势的两个参数,即总体的均值和方差。 统计量是样本的数量特征。它随样本的不同而变化,是一个不包含任何未知参数的样本的函数,因此是个随机变量,是总体参数的估计量。 二、抽样方法 为了保证从抽样结果能较正确地推断出总体的数量特征,抽样时对抽取样本的程序和方法进行周密的设计和安排,这就称为抽样方法或抽样的组织方式。抽样方法有很多种,其中基本的抽样方法有以下几种:简单随机抽样、分层抽样、等距抽样、整群抽样和多阶段抽样等。 (一)简单随机抽样 简单随机抽样是按照随机性的原则,保证总体中每个单位被抽中的机会都相等的一种抽样方法。这种方法在实践中也有很大的局限性,只适用于总体单位数较少而分布又集中的情形。简单随机抽样又可以分为重复抽样和不重复抽样两种方法。 (二)分层抽样 分层抽样又称为分类抽样或类型抽样。它是先将总体各单位按照其属性特征分成若干个组,称为层次或类型,然后在各层或类中用简单随机抽样法或等距抽样法抽取出所需要的样本单位。分层抽样法通过分层可以保证同一层中各单位之间的差异较小。分层抽样法最适宜于总体情况比较复杂,各层次或类型之间的差异较大,而总体单位数又较多的情形。分层抽样又可以分为:等比例分层抽样法、等数分层抽样法和最优分配的分层抽样法。 (三)等距抽样 等距抽样又称为系统抽样或机械抽样。这种方法先将总体中各单位按某一标志顺序排列,然后每隔一定的间距抽取样本单位。等间距抽样时的关键是确定在第一个间距内抽样单位的位置。其余各抽样单位就可以按每隔一个等间距来确定。这样可以保证样本单位在总体中能均匀分布。等距抽样的优点是抽样方式简单、容易实施,所以应用广。 (四)整群抽样 整群抽样就是将总体中的单位按一定的标志或要求分成若干群,然后以群为单位,随机地抽取几个群,对已抽中的群进行全面调查或抽样调查的一种抽样方式。采用整群抽样时,抽取的样本单位比较集中,因此,抽样调查实施起来就比较简单方便,可以节省人力、物力和财力。 (五)多阶段抽样 从总体中进行一次抽样就产生一个完整样本的抽样方法,通常称为单阶段抽样。将整个抽样过程分为几个阶段,然后逐阶段进行抽样,最终得到所需要的有代表性的样本,这种抽样方法称为多阶段抽样。 第二节 抽样分布 一、关于正态分布理论的简要回顾 许多自然界和社会经济现象中随机变量的取值都是连续的,而且体现出中间大、两头小的特征。这往往就是正态分布的特点。正态分布就是一种最重要、最常见的连续型随机变量的概率分布。 正态分布随机变量的重要的特征 1.正态分布曲线只有一个顶点,左右对称,通常称为钟形曲线。2.正态分布总体的均值就是正态曲线的中心。在X=处,概率密度函数取到最大值。X离越远取值越小。曲线两个尾端趋向无穷小,但永远不会与横轴相交。 3.概率密度函数的曲线与X轴所围成的面积等于1。 当方差 越小时,曲线越陡;方差越大时,曲线越平坦。而当固定,变化时,曲线形状不变,只是位置左右移动。 一般地说,若某一变量受到多个随机因素的影响,而各个因素所起的作用都不大时,这个变量就服从正态分布。许多随机变量的分布都可以用正态分布来近似。正态分布中,当参数=0,=1时,我们把这种正态分布称为标准正态分布。 当随机变量X服从标准正态分布时,就记作,统计学上已编制成了现成的标准正态分布函数值表。要使用标准正态分布的累积分布函数值时只要查表就可以了。标准正态分布也称为Z分布。 正态分布随机变量落在某个特定范围内的概率大小 1.随机变量的取值落在均值(期望值)加减1个标准差的范围内的概率是68%。 2.随机变量的取值落在均值(期望值)加减2个标准差的范围内的概率是95%。 3.随机变量的取值落在均值(期望值)加减3个标准差的范围内的概率是99%。 二、抽样分布和抽样误差 从同一总体中抽取出的不同样本,其统计量的值是不同的。全部可能样本的统计
文档评论(0)