03-数值变量资料的统计推断.pptVIP

下载本文档

0
0
约3.43千字
约 139页
2025-12-31 发布于江西
举报
版权申诉

03-数值变量资料的统计推断.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

预防医学

第八章：数值变量的统计推断;第八章提纲;样本;统计推断;统计推断;在统计推断过程中的一些问题;抽样误差;已知某地高中三年级男生的身高满足正态分布，其平均身高为168.15厘米，这里，将该地高中三年级男生的身高视为一个总体。现从该总体中随机抽样5次，每次抽取一个样本含量n=10的样本，得到的5个样本的数据及各样本均数如下：;样本均数的抽样分布;n=4;从正态分布总体N(168.15,62)中随机抽样10000次的结果

曲线是正态总体N(168.15,62)的概率密度曲线

直方图为正态分布总体N(168.15,62)的样本均数的频率密度图;大多数的样本均数相互之间存在差异，绝大多数的样本均数不等于x的总体均数

样本均数的集中趋势位置与个体资料x的集中趋势位置较为接近，样本均数的频数图均呈现出中间多、两边少且基本对称的正态分布特征。

样本均数的分布范围较个体值小；随着样本含量的增大，样本均数的频数分布范围越来越窄

每种样本量的10000个样本均数值所计算出的样本均数的标准差都非常接近(?为个体资料x的总体标准差，n为个体数);理论上可以证明：从正态分布的总体中随机抽取样本含量为n的一批样本，样本均数有如下性质：

样本均数服从正态分布

样本均数的总体均数为

;?=50;样本均数的标准误;样本均数的标准误;样本均数标准误的估计值;例：;个体值～正态分布;Z值～标准正态分布;样本均数～正态分布;样本均数Z转换～标准正态分布;既往资料表明某市区新生女婴的平均出生体重为3.10kg，标准差为0.59kg。某研究者从该市区中随机抽取一个由100个女婴组成的样本，测得样本均数为2.87kg；请问本次抽样研究的结果算不算是偶然事件？;样本均数标准正态性转换中的实际问题;在正态总体N(168.18,62)中随机抽样，样本量分别取n=5，n=100，均抽10000个样本，分别计算Z’值和Z值，其结果如下：;样本含量n=5;上述10000个样本所计算出的Z值和Z’值的平均值都非常接近标准正态分布的集中位置0

对于Z值而言，无论n=5和n=100，Z值的P2.5和P97.5都十分接近标准正态分布95％的双侧分位点±1.96；但对于Z’值而言，样本量n=5时，其P2.5和P97.5明显远离±1.96，而样本量n=100时，Z’值的P2.5和P97.5相对比较靠近

当样本量较大时，同样可以发现统计量Z’的频数图与标准正态分布曲线非常接近，而当样本含量较小时，统计量Z’的分布与标准正态分布则有所区别;Z’的分布;WilliamSealeyGosset(1876-1937);t分布;t分布曲线是单峰的，且关于t=0对称，这一特征与标准正态分布很相似;当自由度v改变时（实际上是样本含量n改变时），t分布曲线的形态也不一样，因此t分布是一簇分布；而标准正态分布是唯一的;v越小（n越小）则标准误越大，样本均数经过t转换后的t值越分散，t分布的峰越低矮，而且尾部翘得也越高；当自由度逼近∞，因s逼近s，t分布也逼近Z分布，所以标准正态分布是t分布的特例;t分布曲线的特征;t分布与标准正态分布的联系;t分布曲线下面积;t分布曲线下面积;t分布曲线下面积;求自由度v为10，单尾概率a=0.05时的t界值，并简述其含义

由表中查得单侧t0.05,10＝1.812

从一个正态总体中随机抽样，每次抽11个个体，分别计算各个样本的均数与标准差，并对之进行t转换后，理论上有P（t≤-1.812）=0.05或P（t≥1.812）=0.05;求自由度v为100，双尾概率a=0.05时的t界值，并简述其含义

由表中查得双侧t0.05/2,100＝1.984

从一个正态总体中随机抽样，每次抽101个个体，分别计算各个样本的均数与标准差，并对之进行t转换后，理论上有P（t≤-1.984）＋P（t≥1.984）=0.05;样本均数的抽样分布小结;二、总体均数的估计;点估计pointestimate：用样本的估计量直接作为总体参数的估计值；例如，用样本均值直接作为总体均值的估计

其方法简单，但未考虑抽样误差的大小

;为了解某地1岁婴儿的血红蛋白浓度，从该地随机抽取了1岁婴儿25人，测得其血红蛋白的平均数为123.7g／L，标准差为11.9g／L；试估计该地1岁婴儿的血红蛋白的平均浓度

本例样本均数为123.7g／L，若用点值估计，则该地1岁婴儿血红蛋白浓度的总体均数μ为123.7g／L

但是这个结论将带有很大的偶然性，因为通常情况由于抽样

您可能关注的文档

文档评论（0）

157****9175 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

03-数值变量资料的统计推断.pptVIP