- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3.抽样误差和 t 分布 抽样误差的概念 由抽样引起的样本统计量与总体参数间的差异 两种表现形式 样本统计量与总体参数间的差异 样本统计量间的差异 抽样研究 个体变异 均数的抽样误差及标准误 表现一:样本均数与总体均数之差值 表现二:多个样本均数间的离散度 中心极限定理(central limit theorem) 从均数为?、标准差为 的总体中独立随机抽样,当样本含量n增加时,样本均数的分布将趋于正态分布,此分布的均数为?,标准差为 标准误(standard error,SE) 样本统计量的标准差称为标准误,用来衡量抽样误差的大小。 样本均数的标准差称为标准误。此标准误与个体变异 成正比,与样本含量n的平方根成反比。 实际工作中, 往往是未知的,一般可用样本标准差s代替 : 因为标准差s随样本含量的增加而趋于稳定,故增加样本含量可以降低抽样误差。 中心极限定理表明,即使从非正态总体中随机抽样,只要样本含量足够大,样本均数的分布也趋于正态分布 ,见图3.1 。 图3.1描述了来自不同总体的样本均数之抽样误差和抽样分布规律。事实上,任何一个样本统计量均有其分布。统计量的抽样分布规律是进行统计推断的理论基础。 标准差与标准误的联系和区别 联系 都是变异指标。S反映个体观察值的变异;反映统计量的变异。 当n不变时,标准差↑,标准误↑ t分布 设从正态分布N(?, )中随机抽取含量为n的样本,样本均数和标准差分别为 和s,设: 则t值服从自由度为n-1的t分布(t-distribution)。Gosset于1908年在《生物统计》杂志上发表该论文时用的是笔名“Student”,故t分布又称Student t分布。 t分布的特征 t分布为一簇单峰分布曲线 t分布以0为中心,左右对称 t分布与自由度?有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高,;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。 t分布的特征 每一自由度下的t分布曲线都有其自身分布规律 t分布表明,从正态分布总体中随机抽取的样本,由样本计算的t值接近0的可能性较大,远离0的可能性较小。t0.05,10=2.228,表明,从正态分布总体中抽取样本含量为n=11的样本,则由该样本计算的t值大于等于2.228的概率为0.025,小于等于-2.228的概率亦为0.025。 P(t≤-2.228)+P(t≥2.228)=0.05 或:P(-2.228t2.228)=1-0.05=0.95。 * Sampling error and t distribution 抽样误差产生的条件 四个非正态分布的总体抽样结果 (A偏三角分布、B均匀分布、C指数分布、D双峰分布) f(t) ? =∞(标准正态曲线) ? =5 ? =1 0.1 0.2 -4 -3 -2 -1 0 1 2 3 4 0.3 图3.2 自由度分别为1、5、∞时的t分布 * *
文档评论(0)