- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医学统计学正态分布(已处理).doc
正态分布及其应用 Normal distribution and its applications 统计学中最重要的理论分布之一 主要内容 Content 正态分布的概念及图形 正态分布的特征 正态分布曲线下面积的规律 标准正态分布 正态分布的应用 正态曲线 正态曲线是由德国的机会数学家 Abraham de Moivre 在 1733 年时提出的。 正态曲线的形状像一个古式的座钟,中间 高,两端低平,无限延伸与横轴相近而不相 交。 正态曲线 正态分布 在1870 年时,德国数学家 Gauss 发现,许多 频数表资料用频数分布图表示时有正态曲线的 形状。 正态分布 正态分布 正态分布 因而人们将频数分布图的形状是正态曲线的 随机变量称为是服从正态分布的随机变量。 也就是说,某地成年男子的红细胞数是服从 正态分布的。以x表示红细胞数量,则x是服从 正态分布的随机变量。 正态曲线的特征 (1)以μ 为中心左右完全对称的单峰钟形曲线; (2)曲线最高峰处对应横轴上的数值是 μ ,曲 线两尾沿 X 轴左右延伸,越远离 μ 的 x ,y 值越小; (3)整条正态分布曲线与横轴所围成的面积等 于1; 正态曲线的特征 正态分布的特征 (5)σ决定分布的形状,当σ大时,整个分布在横轴 上拉得很开,曲线是“矮胖”型,当σ小时,整个分布 在横轴上比较收缩,曲线是“瘦高”型; 例如,μ 相同而σ不同的两个正态分布 (σ 0 σ1 ) 方差相等、均数不等的正态分布图示 均数相等、方差不等的正态分布图示 二、正态曲线下面积的分布规律 对任意一个服从正态分布的随机变量,可作如下标准化变换, 经此变换, Z服从总体均数为0,总体标准差为1的正态分布。 记为N(0,1)。 标准正态分布是一条曲线。 正态曲线下的面积规律 X轴与正态曲线所夹面积恒等于1 。 对称区域面积相等。 正态曲线下的面积规律 对称区域面积相等。 正态曲线下的面积规律 正态曲线下面积总和为1; 正态曲线关于均数对称;对称的区域内面积相等; ?-1.64?~ ?+1.64?内面积为90%; ?-1.96?~ ?+1.96?内面积为95%; ?-2.58?~ ?+2.58?内面积为99%。 例:某地1986年120名8岁男孩身高均数123.02cm, 标准差为4.79cm,试估计: 1)该地8岁男孩身高在130cm以上者占该地8岁男孩 总数的百分比; 2)身高在120-128cm者占该地8岁男孩总数的百分 比; 3 该地80%的男孩身高集中在哪个位置? 总结 正态分布是描述个体变异的重要分布之一,也是统计学理论中的重要分布之一; 正态分布是一簇分布,由两个参数决定:均数和标准差; 正态分布曲线下的面积是有规律的,且与标准正态分布曲线下的面积对应。 二、正态分布的应用 估计变量值的频数分布 制定参考值范围 质量控制 正态分布是很多统计方法的基础 估计频数分布 某项目研究婴儿的出生体重服从正态分布,其均数为3150g,标准差为350g。若以2500g作为低体重儿,试估计低体重儿的比例。 首先标准正态变换: 查标准正态分布表: ? -1.86 0.0314 结果:估计低体重儿的比例为3.14%. 基本概念 通常指特定的“正常人群”(排除了对所研究指标有影响的疾病和有关因素的特定人群)的解剖、生理、生化、免疫及组织代谢产物含量等数据中大多数个体的取值所在范围。 参考值范围的确定 参考值范围: (1)大多数“正常人”的取值范围 ――“大多数”:90%、95% or 99% ――“正常人”:必须明确定义 (2)由大样本来确定(一般要求n>100) (3)可以用作诊断标准吗? 1、若变量服从正态分布 根据正态分布的性质,μ±1.96σ覆盖95%的“正常人” 然而, μ、σ通常是未知的,我们经常用x、s代替 因此,参考值范围: X±1.96s 2、若变量不服从正态分布 采用百分位数法:找出百分位数P2.5和百分位数P97.5 因此双侧参考值范围: ( P2.5 , P97.5 ) ----该法适用于任何分布类型的资料。 决定取单侧范围还是双侧范围值 有些指标如白细胞数过高或过低均属异常 a ,故 其参考值范围需要分别确定下限和上限,称作双侧。有些 指标如24小时
文档评论(0)