- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第五章正态分布
白志茂
5.1随机变量的概率分布总体内个体间的变异总是客观存在的,但其变量值的分布是有一定规律的如第二章例2.1某地120名7岁男童身高资料频数身高(cm)1081101121141161181221241261281301320510152025120取不同随机变量值的概率按随机变量值的分布称为随机变量的概率分布1概率分布是统计学赖以发展的理论基础,任何统计方法都离不开特定的统计分布201随机变量的分类:连续型随机变量和离散型随机变量随机变量:无法事先确定其具体取值的变量02如:身高、体重等数值变量连续型随机变量:可在某一实数区间内任意取值03如:性别、血型等分类变量及门诊接待的病人数等离散取值的变量离散型随机变量:变量只取有限个数或可列个数两个重要概念:分布函数和密度函数1分布函数F(X)即总体中个体值小于或等于X的观察值所占的比例2密度函数f(X)对离散型随机变量,f(X)是变量取X值的概率,常记为P(X).对连续性随机变量,f(X)是F(X)的导函数35.2正态分布频率密度图:直条高度表示频率密度,直条面积表示频率大小正态分布又称Gauss分布,是最重要一种的连续型分布。‘数学王子’高斯(1777-1855)德国数学家、物理学家、天文学家一般说来,若影响某一数量指标的随机因素很多,而每个因素所起的作用均不太大,这个指标服从正态分布。某些医学现象服从或近似服从正态分布;1如:同性别、同年龄儿童的身高,同性别健康成人的红细胞数,血红蛋白量,脉搏数等,以及实验中的试验误差等很多统计方法是建立在正态分布的基础之上的;2如:t检验,卡方检验,F检验很多其他分布的极限为正态分布。3如:t分布,卡方分布,二项分布等分布4因此,正态分布是统计分析方法的重要基础。5正态分布的重要性则称随机变量X服从正态分布,X为正态变量。式中μ为随机变量X的总体均数,σ为标准差;若X服从均数为μ,方差为σ2的正态分布,则简记为。若随机变量X的密度函数是:5.2.1正态分布的定义总体均值为零,标准差为1的正态分布称为标准正态分布,记作标准正态分布的密度函数正态分布的一种重要特例:标准正态分布。5.2.2正态分布的性质正态分布只有一个高峰,高峰位置在X=μ正态分布以均数为中心,左右对称正态分布的两个参数μ和σ决定了分布的位置和形状。μ是位置参数,当σ恒定时,μ越大,则曲线沿横轴越向右移动;反之,μ越小,则曲线沿横轴越向左移动。?3?1?2σ是变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越“矮胖”;σ越小,表示数据越集中,曲线越“瘦高”??2?1?3正态变量的线性变换u称为标准正态差图5.4一般正态分布变换成标准正态分布示意图当资料服从正态分布时,估计某区间的例数占总例数的百分数,或变量值落在某区间的概率如:估计7岁男童身高低于110cm的比例;任取一名7岁男童,身高高于125cm的概率是多少等问题。正态曲线下面积的分布规律0102F(X)xF(X)为正态变量X的累计分布函数,反映正态曲线下,横轴尺度自-∞到X的面积XuΦ(u)为标准正态变量u的累计分布函数标准正态分布曲线下面积?(u)u 0.00 0.020.040.060.08-3.0 0.00130.00130.00120.00110.0010-2.5 0.0062 0.00590.00550.00520.0049-2.0 0.0228 0.02170.02070.01970.0188-1.9 0.0287 0.02740.02620.02500.0239-1.6 0.0548 0.05260.05050.04850.0465-1.0 0.1587 0.15390.14920.14460.1401-0.5 0.3085 0.30150.29460.28770.28100 0.5000 0.49200.48400.47610.46810u*
文档评论(0)