正态分布及均数抽样误差.pptx

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
例2.1 某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如表2-1;红细胞数;直方图;f(x)=(fi/n);随着组段不断分细和观察人数的增多,直条顶端将逐渐接近于一条光滑的曲线,如下图。这条曲线称为频率密度曲线,呈中间高、两边低、左右对称,形状似座钟。类似于数学上的正态分布曲线。 因为频率的总和等于1,故横轴上曲线下的面积等于1。;6;这条所描述的分布,便近似于我们通常所说的正态概率分布,简称正态分布。;一、正态分布的密度函数;二、 正态分布的特征 1.正态分布在横轴上方,均数处最高,以均数μ为中心,左右对称。 2.正态分布的X取值范围理论上没有边界,X离μ越远,f(X)值越接近0,但不会等于0。 3.正态分布曲线下的面积分布有一定的规律。 ;4.正态分布完全由两个参数即均数μ与标准差σ决定,其中μ是位置参数,σ是变异参数。常用N(μ,σ2 )来表示。;μ=0、σ=1的标准正态分布;标准正态分布曲线及其面积分布;三、正态分布的应用 不少医学现象服从正态分布或近似正态分布 估计医学参考值范围 质量控制 正态分布是很多统计方法的理论基础;医学参考值范围的估计;医学参考值范围的估计;正态分布法 适用于正态或近似分布资料 ;常用的u界值;18;例;百分位数法: 适用于偏态分布资料;例7.13 某年某市调查了200例正常成人血铅含量(μg/100g)如下,试估计该市成人血铅含量95%医学参考值范围(用百分位数法计算)。;22;练习1: 调查某地120名健康女性血红蛋白,直方图显示,其分布近似于正态分布,其血红蛋白平均值为117.4(g/L),标准差为10.2 (g/L),试估计该地健康女性血红蛋白的95%医学参考值范围。;一、均数的抽样分布与抽样误差;25;26;110名20岁健康男大学生的身高均数为172.73cm。; 已知Σf=110,ΣfX=19000,需要在该表中增加fx2栏,由第(3)、(4)栏相乘,再将该栏数据相加,将ΣfX2=3283646代入公式 ;110名20岁男大学生的平均身高X=172.73cm,标准差s=4.09cm。;计算得: X1=173.22 s1=4.05;重复100次刚才的抽样,得到100个样本(每个样本含量均为10个),可算得100个样本均数X。;各样本均数的均数X=172.66(cm);33;总体均数为μ,标准差??;根据正态分布原理,若随机变量X服从正态分布,则样本均数X也服从正态分布。;样本均数的抽样分布具有以下特点: 各样本均数未必等于总体均数; 样本均数之间存在差异; 样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右基本对称,也服从正态分布; 样本均数的变异较之原变量的变异大大缩小。;均数的标准误及计算 反映均数抽样误差大小的指标是样本均数 X 的标准差简称标准误(理论值),用 表示,或SE、SEM。; 由于在实际抽样研究中?往往未知,通常用某一样本标准差s来替代?,得标准误的估计值 (通常也简称为标准误),其计算公式为:; 一般情况下?未知,常用 估计抽样误差的大小。 作为 的估计值。;例:已知 s=6.85, n=100 则样本均数的抽样误差 为多少? ;标准误的应用 1.反映样本均数的可靠性; 标准误反映抽样误差的大小。标准误大,表示抽样误差大,则样本均数估计总体均数的可靠性差。反之,标准误小,抽样误差小,样本均数估计总体均数的可靠性好。 2.估计总体均数的可信区间; 3.用于均数的假设检验。 ;二、总体均数的可信区间估计;(二)区间估计: 结合样本统计量和标准误可以确定一个具有一定可信度的包含总体参数的区间,该区间称为总体参数的1-α可信区间(confidence interval,CI);即按一定的概率估计未知总体均数的所在范围。 习惯上用总体均数的95%(或99%)可信区间,表示该区间包含总体均数?的概率为95%(或99%),用此范围估计总体平均数,表示100次抽样中,有 95(99)次包含总体均数。 ;(1)?未知,但样本例数n足够大(如n50),总体均数的1-α双侧可信区间为;例 某市2000年随机测量了90名19岁健康男大学生的身高,其均数为172.2cm,标准差为4.5cm,试估计该市2000年19岁健康男大学生平均身高的95%可信区间。;t 分 布; ;标准正态分布N(0,1)。在实际工作中,?往往是未知,常用 替代 ,即

文档评论(0)

老师驿站 + 关注
官方认证
内容提供者

专业做教案,有问题私聊我

认证主体莲池区卓方网络服务部
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0GFXTU34

1亿VIP精品文档

相关文档