3第四章 抽样分布.ppt

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
从总体中抽取的样本提供的信息仅是总体的一部分,它不能提供完全准确的信息,必然存在着一定的误差。 对于样本容量相同的多次随机抽样样本,其统计量是变异的,且其取值有一定的概率,即样本统计量也是一个随机变量,此分布规律称为抽样分布(sampling distribution)。 总体 样本1 x1 样本2 x2 样本3 x3 样本n xn 第四章:统计数的分布——抽样分布 如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估计值。 样本平均数 x 是总体平均数μ的无偏估计值。 样本方差 s2 是总体方差σ2的无偏估计值。 样本标准差 s 不是总体标准差σ的无偏估计值。 一、抽样试验与无偏估计 二、样本平均数的分布 (1)样本平均数分布的平均数=总体平均数。 (2)样本平均数分布的方差=总体方差除以样本容量。 样本平均数的标准误差(标准误) (standard error of mean) 二、样本平均数的分布 (3)如果从正态分布总体N(μ,σ2)进行抽样,其样本平均数x是一具有平均数 μ,方差σ2/n的正态分布,记作N(μ,σ2/n)。 中心极限定理 (central limit theorem) 连续型变量 离散型变量 (4)如果被抽总体不是正态分布总体,但具有平均数μ和方差σ2 ,当随样本容量n的不断增大,样本平均数 x 的分布也越来越接近正态分布,且具有平均数μ,方差σ2 /n 。 偏态分布 正态分布 不论总体为何种分布,只要是大样本,就可运用中心极限定理,认为样本平均数的分布是正态分布,在计算样本平均数出现的概率时,样本平均数可按下式进行标准化。 样本平均数差数的分布 从两个相互独立的正态总体中抽取样本,得到样本平均数差数的分布也是正态分布。样本平均数差数的平均数等于总体平均数的差数,样本平均数差数的方差等于两样本平均数方差除以各自样本容量之和。 如,从N(5,25)的总体中抽取n1=35的样本,从N(10,5)的总体中抽取n2=40的样本,则两样本平均数差数的平均数为-5。方差为25/35+5/40=47/56 三、样本平均数差数分布 四、 t 分布 在实际研究中,经常遇到σ 未知,且样本容量n不大的情况,这时若用 s 来代替σ。其并不服从正态分布,而是服从具n-1自由度的t分布。 t分布 标准差已知的样本平均数分布 u= t= 总体方差未知或样本容量n小于30时,标准离差的分布呈t分布。 四、 t 分布 对于不同的自由度,t分布有不同的曲线。 四、 t 分布 ( 1 ) t分布曲线左右对称,围绕平均数μt =0 向两侧递降。 (2)t分布受自由度df=n-1制约,每个df都有一条t分布曲线。 (4)和正态分布相比,t分布的顶端偏低,尾部偏高,自由度df30时,其曲线接近正态分布曲线,df→∝时则和正态分布曲线重合。 (3)df小,t值离散程度大。 四、t 分布 t分布曲线与横轴所围成的面积为1。 同标准正态分布曲线一样,统计应用中最为关心的是t分布曲线下的面积(即概率P)与横轴t值间的关系。 为使用方便,统计学家编制了不同自由度df下的t界值表。 在相同的自由度df时,t值越大,概率P越小。 在相同t值时,双尾概率P为单尾概率P的两倍。 df增大,t分布接近正态分布,即t值接近u值。 在相同的P值下,随df的增加,临界t值减小。 四、t 分布 t落于[- t0.05, + t0.05 ] 内的概率为0.95 t落于[- t0.01, + t0.01 ] 内的概率为0.99 置信度为5%和1%的t临界值。 t0.05(4)=2.776 t0.01(4)=4.604 -2.776          +2.776 五、 χ2分布 df = n-1 样本方差的分布 五、 χ2分布 概率密度函数 概率累积函数 五、 χ2分布 χ2分布是连续型变量的分布,每个不同的自由度都有一个相应的卡方分布曲线,所以其分布是一组曲线。 五、 χ2分布 特征 χ2分布于区间[0,+∝ ),并且呈反J型的偏斜分布。 χ2分布的偏斜度随自由度降低而增大,当自由度df=1时,曲线以纵轴为渐近线。 随自由度df的增大, χ2分布曲线渐趋左右对称,当df30时,卡方分布已接近正态分布。 1 2 3 五、 χ2分布 对于给定的α(0α1), 称满足条件 P{χ2 χα2(n)}=α的点 χα2(n)为 χ2分布的α上侧分位数(右尾概率)。 χ2分布是不对称的 表中表头的概率α是χ2大于表内所列χ2值的概率。 df = 2 P(χ2 ≧ 5.99)=0.05 P(χ2 ≧ 9.21)=0.01 P(χ2 ≧ 0.10)=0.95 六、 F 分布

文档评论(0)

canjiadyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档