- 1、本文档共82页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
章 抽样分布与参数估计 课件
统计学导论;第四章 抽样分布与参数估计 ;第一节 抽样的基本概念与数学原理;一、有关抽样的基本概念;(二)总体参数与样本统计量
1.总体参数。总体分布的数量特征就是总体的参数,也是抽样统计推断的对象。
常见的总体参数有:总体的平均数指标,总体成数(比例)指标,总体分布的方差、标准差等等。它们都是反映总体分布特征的重要指标。; 2.样本统计量。样本统计量是样本的一个函数。它们是随机变量。我们利用统计量来估计和推断总体的有关参数。
常见的样本统计量有:
样本平均数,样本比例,
样本的方差、标准差。;所谓概率抽样,就是要求对总体的每一次观察(每一次抽取)都是一次随机试验,并且有和总体相同的分布。按这样的要求对总体观测(抽取)n次,可得到容量为n的样本。 ;8;9;(四)放回抽样与不放回抽样;2.不放回抽样;从总体中可以随机地抽取许多样本,由每一个样本都可以计算样本统计量的观测值,所有可能的样本观测值及其所对应的概率便是所谓的抽样分布。因此,抽样分布也可以称为样本统计量的概率分布。
抽样分布可能是精确地服从某种已知分布(所谓已知分布,例如我们在第四章介绍过的各种常见分布),也可能是以某种已知分布为极限分布。在实际应用中,后者更为多见。;13;14;;表5-4 任职年限样本均值分布数列;17;二、大数定理与中心极限定理; 大数定理表明:尽管个别现象受偶然因素影响,有各自不同的表现。但是,对总体的大量观察后进行平均,就能使偶然因素的影响相互抵消,消除由个别偶然因素引起的极端性影响,从而使总体平均数稳定下来,反映出事物变化的一般规律。 ;20; 从正态分布的再生定理可以看出,只要总体变量服从正态分布,则从中抽取的样本,不管n是多少,样本平均数都服从正态分布。但是在客观实际中,总体并非都是正态分布。对于从非正态分布的总体中抽取的样本平均数的分布问题,需要由中心极限定理来解决。;(三)中心极限定理;23;第二节 抽样分布;一、样本平均数的抽样分布;26;27;28;(二)样本平均数的分布规律;30;31;二、样本比例的抽样分布 ;33;34;35;(二)样本比例的分布规律;表5-5 用正态分布来近似时对样本量的要求;(三)样本方差的抽样分布;39;第三节 参数估计 ;一、参数估计概述;点估计,主要有矩估计法和最大似然估计法。
矩估计法是用样本矩去估计总体矩(或是用样本矩的函数去估计总体矩的相应函数)的一种估计方法,由此获得的估计量称作矩估计量。
最大似然估计法是把待估计的总体参数看作一个可以取不同数值的变量,计算当总体参数取上述不同数值的时候,发生我们当前所得到的样本观测值的不同概率,总体参数取哪一个数值的时候这种概率最大,便把这个数值作为对总体参数的估计结果。;(三)估计量的优良标准;4. 充分性。估计量包含了样本中关于θ的全部信息。;(四)区间估计与估计的精度和可靠性;46;47;二、总体均值的估计
;49;50;51;52;53;54;(二)总体方差σ2未知的情形;2. 区间估计;57;58;【例5-4】在例5-3中,若总体方差未知,但通过抽取的6个样本测得的样本方差为0.0025,试在0.95的置信度下,求该产品直径的均值置信区间。;三、总体比例的估计
;61;62;三、总体方差的估计
;(二)区间估计;65;第四节 样本容量的确定; 由前面的论述,我们已知参数估计中的精度要求与可靠性要求常常是一对矛盾,但是,通过增加样本容量n有可能降低样本平均数的标准差,从而实现既保证一定的估计精度,又具有较高的置信度的目的。这时,需要考虑在给定的置信度与极限误差的前提下,样本容量n究竟取多大合适?这就是所谓样本容量的确定问题。 ;二、估计总体均值时样本容量的确定;69;70;三、估计总体比例时样本容量的确定;四、使用上述公式应注意的问题; 2.如果进行一次抽样调查,需要同时估计总体均值与比例,可用上面的公式同时计算出两个样本容量,取其中较大的结果,同时满足两方面的需要。;74;75;76;77;第五节 Excel在参数估计中的应用; 2.定义变量名。将A列命名为“x”,将B2单元格命名为“置信水平”。
3.计算置信上、下限。
分别在C2、D2中输入如下的公式:
=AVERAGE(x)-TINV(1-置信水平,
COUNT(x)-1)
*STDEV(x)/SQRT(COUNT(x))
=AVERAGE(x)+TINV(1-置信水平,
COUNT(x)-1)*STDEV(x)/SQRT(COUNT(x))
;本章小结;81;5.所谓估计就是构造适当的样本统计量,来充当总体参数的估计量。好的统计量的理想性质
文档评论(0)