- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样分布
一、抽样分布的理论及定理
(一) 抽样分布
抽样分布是统计推断的基础,它是指从总体中随机抽取容量为的若干个样本,对每一样本可计算其统计量,而个统计量构成的分布即为抽样分布,也称统计量分布或随机变量函数分布。
(二) 中心极限定理
中心极限定理是用极限的方法所求的随机变量分布的一系列定理,其内容主要反映在三个方面。
1.如果总体呈正态分布,则从总体中抽取容量为的一切可能样本时,其样本均数的分布也呈正态分布;无论总体是否服从正态分布,只要样本容量足够大,样本均数的分布也接近正态分布。
2.从总体中抽取容量为的一切可能样本时,所有样本均数的均数()等于总体均数()即
3.从总体中抽取容量为的一切可能样本时,所有样本均数的标准差()等于总体标准差除以样本容量的算数平方根,即
中心极限定理在统计学中是相当重要的。因为许多问题都使用正态曲线的方法。这个定理适于无限总体的抽样,同样也适于有限总体的抽样。中心极限定理不仅给出了样本均数抽样分布的正态性依据,使得大多数数据分布都能运用正态分布的理论进行分析,而且还给出了推断统计中两个重要参数(即样本均数与样本标准差)的计算方法。
(三)抽样分布中的几个重要概念
1.随机样本。统计学是以概率论为其理论和方法的科学,概率又是研究随机现象的,因此进行统计推断所使用的样本必须为随机样本(random sample)。所谓随机样本是指按照概率的规律抽取的样本,
2.抽样误差。从总体中抽取容量为的个样本时,样本统计量与总体参数之间总会存在一定的差距,而这种差距是由于抽样的随机性所引起的样本统计量与总体参数之间的不同,称为抽样误差。
3.标准误。样本统计量分布的标准差或某统计量在抽样分布上的标准差,符号SE或表示。根据中心极限定理其标准差为
正如标准差越小,数据分布越集中,平均数的代表性越好。同理,在推断统计中,标准误越小,说明样本统计量与总体参数的之间越接近,即样本对总体的代表性越好,这时用样本统计量去推断总体就越可靠、越准确;相反,标准误越大,说明样本统计量与总体参数之间的差距越大,即样本对总体的代表性越差,这时用样本统计量去推断总体就越不可靠、越不准确。所以说标准误是进行统计推断可靠性高低的指标。
4.自由度。一群数据或观测值可以独立自由变动的数目称为自由度,用符号或表示。
在中, 。在计算方差或标准差时,因受的限制, ,即有方差。
二、常用抽样分布
在心理与教育统计中,常用的抽样分布有正态分布、渐近正态分布、分布、分布、分布和分布等等。
(一) 正态分布及渐近正态分布
当统计量的分布符合正态分布或渐近正态分布时,进行统计推论的理论依据即为正态分布的理论。以样本平均数为例,正态分布的应用情形如下。
1.总体呈正态,总体方差已知,则样本均数的分布也呈正态。根据中心极限定理则有
① 样本均数的均数等于总体均数,即
② 样本均数的标准差等于总体标准差除以样本容量的平方根,即
③ 差异检验值为
2.总体呈非正态,总体方差已知,样本容量足够大,样本均数的分布为渐近正态分布。根据中心极限定理,亦有
① 样本均数的均数等于总体均数:
② 样本均数的标准差等于总体标准差除以样本容量的平方根。
③ 检验值
(二)分布
1.分布的定义
分布是由小样本统计量形成的概率分布。
2.分布的特点
① t分布也是对称分布。即平均数位于曲线的中央,在这一点上有一个单峰,从中央向两侧逐渐下降,尾部无限延长,但不与基线相交。
② 分布曲线的形状易变,曲线不是一条而是一族,其曲线形状随着样本容量的变化而有规律地变动,即随自由度的大小而变化。
③ 理论上,当→∞时,分布曲线以标准正态曲线为极限,即呈正态分布。当逐渐减少时,
分布的离散程度逐渐增大,曲线逐渐与标准正态分离;其峰顶逐渐下降,尾部抬高。如图7-13所示
④ 分布的值及对应的概率值()是根据自由度的大小由理论模型推导出来的,构成分布临界值,表见附表4。
3.分布的应用
1)总体正态,未知,且<30时,样本平均数的分布呈分布。
分布的标准误为
或
因为总体标准差未知,只能以样本标准差来代替。而样本标准差与总体标准差的差距较大,统计学家发现总体标准差的良好无偏估计量为,即
所以用代替则有上式 。
分布的检验值为
2)总体呈非正态,未知,>30时,则样本均数的分布呈分布或渐近正态分布,其①样本均数的标准误为
或
检验值为
或
此外,当未知时,两个样本均数之差()的分布、相关系数的分布、回归系数的分布等也服从近似正态分布。
参数估计
第一节 统计推断的有关问题
一、 什么是推断统计
推断统计就是指由样本资料去推测相应总体情况的理论与方法。也就是由部分推全体,
由已知推未知的过程。
推断统计根据推测的性质不同而分为参数估计和假设检验两方面。参数估计是用样本去估计相应总体的状况,其
文档评论(0)