03-数值变量资料的统计推断.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

预防医学

第八章:数值变量的统计推断;第八章提纲;样本;统计推断;统计推断;在统计推断过程中的一些问题;抽样误差;已知某地高中三年级男生的身高满足正态分布,其平均身高为168.15厘米,这里,将该地高中三年级男生的身高视为一个总体。现从该总体中随机抽样5次,每次抽取一个样本含量n=10的样本,得到的5个样本的数据及各样本均数如下:;样本均数的抽样分布;n=4;从正态分布总体N(168.15,62)中随机抽样10000次的结果

曲线是正态总体N(168.15,62)的概率密度曲线

直方图为正态分布总体N(168.15,62)的样本均数的频率密度图;大多数的样本均数相互之间存在差异,绝大多数的样本均数不等于x的总体均数

样本均数的集中趋势位置与个体资料x的集中趋势位置较为接近,样本均数的频数图均呈现出中间多、两边少且基本对称的正态分布特征。

样本均数的分布范围较个体值小;随着样本含量的增大,样本均数的频数分布范围越来越窄

每种样本量的10000个样本均数值所计算出的样本均数的标准差都非常接近(?为个体资料x的总体标准差,n为个体数);理论上可以证明:从正态分布的总体中随机抽取样本含量为n的一批样本,样本均数有如下性质:

样本均数服从正态分布

样本均数的总体均数为

;?=50;样本均数的标准误;样本均数的标准误;样本均数标准误的估计值;例:;个体值~正态分布;Z值~标准正态分布;样本均数~正态分布;样本均数Z转换~标准正态分布;既往资料表明某市区新生女婴的平均出生体重为3.10kg,标准差为0.59kg。某研究者从该市区中随机抽取一个由100个女婴组成的样本,测得样本均数为2.87kg;请问本次抽样研究的结果算不算是偶然事件?;样本均数标准正态性转换中的实际问题;在正态总体N(168.18,62)中随机抽样,样本量分别取n=5,n=100,均抽10000个样本,分别计算Z’值和Z值,其结果如下:;样本含量n=5;上述10000个样本所计算出的Z值和Z’值的平均值都非常接近标准正态分布的集中位置0

对于Z值而言,无论n=5和n=100,Z值的P2.5和P97.5都十分接近标准正态分布95%的双侧分位点±1.96;但对于Z’值而言,样本量n=5时,其P2.5和P97.5明显远离±1.96,而样本量n=100时,Z’值的P2.5和P97.5相对比较靠近

当样本量较大时,同样可以发现统计量Z’的频数图与标准正态分布曲线非常接近,而当样本含量较小时,统计量Z’的分布与标准正态分布则有所区别;Z’的分布;WilliamSealeyGosset(1876-1937);t分布;t分布曲线是单峰的,且关于t=0对称,这一特征与标准正态分布很相似;当自由度v改变时(实际上是样本含量n改变时),t分布曲线的形态也不一样,因此t分布是一簇分布;而标准正态分布是唯一的;v越小(n越小)则标准误越大,样本均数经过t转换后的t值越分散,t分布的峰越低矮,而且尾部翘得也越高;当自由度逼近∞,因s逼近s,t分布也逼近Z分布,所以标准正态分布是t分布的特例;t分布曲线的特征;t分布与标准正态分布的联系;t分布曲线下面积;t分布曲线下面积;t分布曲线下面积;求自由度v为10,单尾概率a=0.05时的t界值,并简述其含义

由表中查得单侧t0.05,10=1.812

从一个正态总体中随机抽样,每次抽11个个体,分别计算各个样本的均数与标准差,并对之进行t转换后,理论上有P(t≤-1.812)=0.05或P(t≥1.812)=0.05;求自由度v为100,双尾概率a=0.05时的t界值,并简述其含义

由表中查得双侧t0.05/2,100=1.984

从一个正态总体中随机抽样,每次抽101个个体,分别计算各个样本的均数与标准差,并对之进行t转换后,理论上有P(t≤-1.984)+P(t≥1.984)=0.05;样本均数的抽样分布小结;二、总体均数的估计;点估计pointestimate:用样本的估计量直接作为总体参数的估计值;例如,用样本均值直接作为总体均值的估计

其方法简单,但未考虑抽样误差的大小

;为了解某地1岁婴儿的血红蛋白浓度,从该地随机抽取了1岁婴儿25人,测得其血红蛋白的平均数为123.7g/L,标准差为11.9g/L;试估计该地1岁婴儿的血红蛋白的平均浓度

本例样本均数为123.7g/L,若用点值估计,则该地1岁婴儿血红蛋白浓度的总体均数μ为123.7g/L

但是这个结论将带有很大的偶然性,因为通常情况由于抽样

文档评论(0)

157****9175 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档