第三章标准误t分布参数估计研.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 总体均数的估计与假设检验;教学内容:;抽样研究(sampling study) ; 统计推断(statistical inference) ;总体;;问题:已知某市健康儿童共125万人,想知道其平均血糖水平是多少?;;;;一、均数的抽样误差 与标准误; 已知某地高中三年级男生的身高满足正态分布,其平均身高为168.15厘米,这里,将该地高中三年级男生的身高视为一个总体。现从该总体中随机抽样5次,每次抽取一个样本含量n=10的样本,得到的5个样本的数据及各样本均数如下:;样本号;各个样本均数之间都不相同——抽样误差表现形式之一 各个样本均数都不等于总体均数,有的比总体均数大,有的比它小——抽样误差表现形式之二 相对于各样本的个体值,样本均数间的变异程度较小;;样本均数的抽样分布;;大多数的样本均数相互之间存在差异,绝大多数的样本均数不等于x的总体均数 样本均数的集中趋势位置与个体资料x的集中趋势位置较为接近,样本均数的频数图均呈现出中间多、两边少且基本对称的正态分布特征。 样本均数的分布范围较个体值小;随着样本含量的增大,样本均数的频数分布范围越来越窄 每种样本量的10000个样本均数值所计算出的样本均数的标准差都非常接近 (?为个体资料x的总体标准差,n为个体数) ; 理论上可以证明:从正态分布的总体 中随机抽取样本含量为n的一批样本,样本均数 有如下性质 : 样本均数 服从正态分布 样本均数 的总体均数为 ; 所以若随机变量X服从X~N (μ , s2) 的正态分布,则以之随机抽样计算的样本均数所构成的分布也呈正态分布。;【实验】:下图是一个正偏态分布,用电脑从中随机抽取样本含量分别为5、10、30、50的样本各1000次,计算样本均数,绘制直方图,并观察其样本均数的分布。;n = 5;当样本容量足够大时(n ? 60) ,样本均数的抽样分布逐渐趋于正态分布; 从偏态总体中抽样,当n足够大时(n大于60),其均数也近似于正态分布。;样本均数的标准误证明*;标准误 (standard error of mean,SME或SE)概念:;;标准误 (standard error,SE)概念:即样本均数的标准差,是描述均数的抽样误差大小的指标。;举例:大规模普查得某地健康成年男子血红蛋白总体均数为μ =135g/L,σ=20.5g/L。若在其中进行随机抽样,样本量n=100,样本均数X=130g/L,S=23.4g/L,求其理论标准误和样本均数的估计标准误。;均数μ;标准差? N(μ,?2 ) ;? = 50;标准差与标准误的区别与联系;既往资料表明某市区新生女婴的平均出生体重为3.10kg,标准差为0.59kg ;某研究者从该市区中随机抽取一个由100个女婴组成的样本,测得样本均数超过3.15kg的可能性有多大?; 在正态总体N(168.18,62)中随机抽样,样本量分别取n =5,n =100,均抽10000个样本,分别计算u’值和u值,其结果如下: ;; 并不满足标准正态分布! 在样本含量较大时它与标准正态分布接近,但是当样本含量较小时,它与标准正态分布相差较远;二、t分布;均数μ;标准差? N(μ,?2 );任意正态分布曲线 X~N(μ,σ2);;;u分布;【实验】:从前述13岁女学生身高这个正态总体中分别作样本量为3或50的随机抽样,各取1000份样本,分别得到1000个样本的均数及其标准误,对它们分别作t 转换,将t 值绘成直方图: 。;【实验三】:从前述13岁女学生身高这个正态总体中分别作样本量为3或50的随机抽样,各取1000份样本,分别得到1000个样本的均数及其标准误,对它们分别作t 转换,将t 值绘成直方图: 。;;t 分布曲线下的整个面积为1; t 分布曲线下从a 到b 的面积为t 值分布在此范围内的百分比,即t 值落在此范围内的概率p。;(三)t 界值表:以自由度?为横标目,概率P为纵标目,表中数字表示当?和 P确定时,对应的是正侧或双侧的t 临界值表,记作t(α,?)或t(α/2,?) 。; 自由度?;例1,求当?=9,单尾概率?=0.05时的 t界值;例1,求当?=9,双尾概率?=0.05时的 t界值;;三、总体参数的估计;例:测得某地11名20岁男大学生 身高=172.25cm,S=3.31cm,对该地20岁男大学生身高均数进行估计。;;样本统计量 (点估计);可信区间;可信区间;可信区间;可信区间(confidence interval);可信区间(confidence interval);

文档评论(0)

浪漫唯美-文档菜鸟 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档