第4章统计数的分布.pptVIP

下载本文档

4
0
约2.98千字
约 40页
2017-04-22 发布于四川
举报
版权申诉

第4章统计数的分布.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第4章统计数的分布

第四章统计数的分布（抽样分布）;研究总体与从中抽取的样本之间的关系是统计学的中心内容。对这种关系的研究可从两方面着手，一是从总体到样本，这就是研究抽样分布(sampling distribution)的问题；二是从样本到总体，这就是统计推断(statistical inference)问题。; 由总体中随机地抽取若干个体组成样本，即使每次抽取的样本含量相等，其统计量也将随样本的不同而有所不同。因而样本统计量也是随机变量，也有其概率分布，我们把统计量的概率分布称为抽样分布。;一、抽样试验与无偏估计;100份样本的均数和标准差; 将这100份样本的均数看成新变量值，按第二章的频数分布方法，得到这100个样本均数得直方图见图4-1。; 100个样本均数的抽样分布特点： ① ② 100个样本均数中，各样本均数间存在差异，但各样本均数在总体均数周围波动。 ③样本均数的分布曲线为中间高，两边低，左右对称，近似服从正态分布。 ;２．无偏估计;设有一N=3的近似正态总体，具有变量3，4，5；求得μ=4，σ2=0.6667， σ=0.8165 现以n=2作独立的有回放抽样，总共得Nn=32=9个样本。抽样结果列入下表：;N=3 n=2时抽样的平均数方差标准差;从上表的资料可以求出: 样本平均数的平均数μx=4 样本方差的平均数μS2=0.6667=σ2 样本标准差的平均数μS=0.6285≠0.8165=σ 所以，惟有样本标准差s的平均数不是总体标准差σ的无偏差估计值。其余两个参数为无偏差估计值。;二、样本平均数抽样分布;由这些样本算得的平均数与原总体平均数μ相比往往表现出不同程度的差异。这种差异是由随机抽样造成的，称为抽样误差(sampling error)。显然，样本平均数也是一个随机变量，其概率分布叫做样本平均数的抽样分布。由样本平均数构成的总体称为样本平均数的抽样总体，其平均数和标准差分别记为和。 ; 是样本平均数抽样总体的标准差，简称标准误(standard error)，它表示平均数抽样误差的大小。统计学上已证明总体的两个参数与x 总体的两个参数有如下关系： ;即样本均数的标准差，可用于衡量抽样误差的大小。因通常σ未知，计算标准误采用下式：;设有一个N=4的有限???体，变数为2，3，3，4。根据μ=Σx／N和σ2=Σ(x-μ)2／N求得该总体的μ、σ2、σ为： μ=3，σ2=1／2，σ=（1/2）1/2=0.707;从有限总体作返置随机抽样，所有可能的样本数为Nn其中n为样本含量。以上述总体而论，如果从中抽取n=2的样本，共可得 42=16 个样本；如果样本含量n为4，则一共可抽得44=256个样本。分别求这些样本的平均数，其次数分布如下表所示。在n=2的试验中，样本平均数抽样总体的平均数、方差与标准差分别为： ; =4/16=1/4=(1/2)/2= σ2/n;表 N=4, n=2和n=4时的次数分布; 同理，可得n=4时：验证了的正确性。也可以将表中两个样本平均数的抽样总体作次数分布图。 ;由以上模拟抽样试验可以看出，虽然原总体并非正态分布，但从中随机抽取样本，即使样本含量很小，样本平均数的分布却趋向于正态分布形式。随着样本含量 n 的增大，样本平均数的分布愈来愈从不连续趋向于连续的正态分布。当n＞30时，的分布就近似正态分布了。X变量与变量概率分布间的关系可由下列两个定理说明： ;1. 若随机变量x服从正态分布N(μ,σ2)；x1、x2、…、xn，是由x 总体得来的随机样本，则统计量 =Σx／n的概率分布也是正态分布，且有，即服从正态分布N(μ,σ2／n)。 2. 若随机变量x服从平均数是μ，方差是σ2的分布(不是正态分布)； x1、x2、…、xn，是由此总体得来的随机样本，则统计量 =Σx／n的概率分布，当n相当大时逼近正态分布N(μ,σ2／n)。这就是中心极限定理。 ;中心极限定理告诉我们：不论x变量是连续型还是离散型，也无论x服从何种分布，一般只要n＞30，就可认为的分布是正态分布。若x的分布不很偏倚，在n＞20时，的分布就近似于正态分布了。;注意：样本标准差与样本标准误是既有联系又有区别的两个统计量。二者的区别是样本标准差S是反映样本中各观测值的变异程度，它的大小说明了对该样本代表性的强弱。样本标准误是样本平均数