- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
学习目标:了解抽样和抽样分布的基本概念
抽样与参数估计推断统计:利用样本统计量对总体某些性质或数量特征进行推断。从数据得到对现实世界的结论的过程就叫做统计推断 (statistical inference)。这个调查例子是估计总体参数(某种意见的比例)的一个过程。 ????估计 (estimation) 是统计推断的重要内容之一。统计推断的另一个主要内容是本章第二节要介绍的假设检验 (hypothesis testing) 。 ????因此本节内容就是由样本数据对总体参数进行估计,即: 学习目标:了解抽样和抽样分布的基本概念理解抽样分布与总体分布的关系了解点估计的概念和估计量的优良标准掌握总体均值、总体比例和总体方差的区间估计抽样与抽样分布回顾相关概念:总体、个体和样本抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并根据样本数据所提供的信息来推断总体的数量特征。总体(Population):调查研究的事物或现象的全体 参数个体(Item unit):组成总体的每个元素 样本(Sample):从总体中所抽取的部分个体 统计量样本容量(Sample size):样本中所含个体的数量?一般将样本单位数不少于三十个的样本称为大样本,样本单位数不到三十个的样本称为小样本。一、抽样方法及抽样分布1、抽样方法(1)、概率抽样:根据已知的概率选取样本①、简单随机抽样:完全随机地抽选样本,使得每一个样本都有相同的机会(概率)被抽中。注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,又可分为重 复抽样与不重复抽样。而且,根据抽样中是否排序,所能抽到的样本个数往往不同。 ②、分层抽样:总体分成不同的“层”(类),然后在每一层内进行抽样 ③、整群抽样:将一组被调查者(群)作为一个抽样单位 ④、等距抽样:在样本框中每隔一定距离抽选一个被调查者(2)非概率抽样:不是完全按随机原则选取样本 ①、非随机抽样:由调查人员自由选取被调查者 ②、判断抽样:通过某些条件过滤来选择被调查者(3)、配额抽样:选择一群特定数目、满足特定条件的被调查者2、抽样分布一般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(sampling distribution)。某个样本统计量(如均值、比例、方差等)的抽样分布,从理论上说就是在重复选取容量为n的样本时,由每一个样本计算出的该统计量数值的相对频数分布或概率分布。二、样本均值的抽样分布与中心极限定理1、样本均值的抽样分布(一个例子)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下均值和方差 现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表所有可能的n=2的样本(共16个)第一个观察值第二个观察值1,11,21,31,42,12,22,32,43,13,23,33,44,14,24,34,4计算出各样本的均值,如下表。并给出样本均值的抽样分布16个样本的均值(x)第一个观察值第二个观察值1.01.52.02.51.52.02.53.02.02.53.03.52.53.03.54.0所有样本均值的均值和方差: 式中:M为样本数目比较及结论:1. 样本均值的均值(数学期望)等于总体均值2. 样本均值的方差等于总体方差的1/n2、中心极限定理当总体服从正态分布N ~ (μ,σ2 )时,来自该总体的所有容量为n的样本的均值也服从正态分布,的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)中心极限定理:设从均值为μ,方差为σ2的一个任意总体中抽取容量为n的样本,当n充分大时(一般,就可以用中心极限定理了),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。即有: 和 也即有, ~其实,样本均值抽样分布的数字特征一方面与总体分布的均值和方差有关,另一方面也与抽样的方法是重复抽样还是不重复抽样有关。无论是重复抽样或不重复抽样,样本均值的数学期望始终等于总体的均值。但在不重复抽样条件下,样本均值的方差需要用修正系数去修正重复抽样时均值的方差。当很大,而时,其修正系数,可视不重复抽样与重复抽样一致。总体分布总体分布正态分布非正态分布大样本小样本大样本小样本正态分布正态分布非正态分布图4.1.3 样本均值的抽样分布与总体分布的关系三、样本比例的抽样分布(Sampling Distribution of p样本比例的抽样分布是样本比例所有可能值的概率分布。(The sampling distribution of p is the probabili
文档评论(0)