- 1、本文档共65页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计第讲.ppt
第四节 正态分布及其应用 第一节 正态分布 二、 正态分布的特征 1.正态分布以均数为中心左右对称 2.正态分布的X取值范围理论上没有边界 3.正态曲线下的面积为1,且分布有一定的规律 4.正态分布完全由参数μ和σ决定。正态分布均数的位置为μ,标准差为σ,常用N(μ,σ2 )来表示;标准正态分布均数的位置为0,标准差为1,常用N( 0,1 )来表示 一、正态分布的密度函数 N(μ,σ2 ) 二、标准正态分布密度函数 令 使得μ=0,σ=1 N( 0,1 ) 标准正态分布曲线下面积 正态分布的特色点的概率 例 某市110名7岁男童身高,其均数为119.95cm,标准差为4.72cm (1)试估计该地7岁男童身高在110cm以下者占该地7岁男童总数的百分数。 (2)试估计该地7岁男童身高在110cm-130cm者占该地7岁男童总数的百分数。 (3)该地80%7岁男童身高集中在哪个范围? 四、正态分布的应用 不少医学现象服从正态分布或近似正态分布 估计医学参考值范围 质量控制 正态分布是很多统计方法的理论基础 医学参考值范围的估计 一、医学参考值的概念 指正常人(或动物)的人体形态、机能和代谢产物等的各种生理及生化常数。 二、医学参考值范围的制定方法 选择足够数量的正常人作为参照样本 对选定的正常人进行准确的测定 判断是否需要分组制定参考之范围 决定取单侧范围还是双侧范围值 选择恰当的百分范围 估计参考值范围的界限(漏诊、误诊) 确定医学参考值范围 例: 估计某地健康成年女子的血红蛋白的95%医学参考值范围 具体步骤如下: 根据研究背景确定研究对象的入选标准和排除标准。这类研究一般要求参加体检并且排除影响血红蛋白的疾病和有关因素。 根据研究背景,确定血红蛋白过高或过低均属于不正常(双侧范围)。 确定医学参考值范围(续) 3.血红蛋白检测的容许误差和研究背景容许误差的范围,确定受检者的样本量。 由于在实际研究中,总体均数和方差均不知道的,需要用样本资料进行估计,所以一般至少在100人以上,这样参数估计的平均误差是资料的离散程度的1/10以下。 确定医学参考值范围(续) 本例:成年正常女子200人的血清总蛋白含量(近似正态分布),得到均数 =73.5克/升,标准差S=3.9克/升。 由于样本量很大,可以用样本均数和标准差近似总体均数和标准差,按下式计算: 确定医学参考值范围(续) 下限: 上限: 即:该地成年正常女子的95%参考值范围为65.9~81.1( g/L) 2.确定正常值范围的一般原则和方法步骤 ①抽取足够例数的正常人样本。 ②根据资料分布类型选择方法。 ③根据专业知识确定该范围的单双侧 例 [例]某地调查正常成年男子144人的红细胞数近似正态分布,得均数5.38(1012/L),标准差0.44(1012/L),试估计该地成年男子红细胞数的95%参考值范围 第十五章 数值变量的统计推断 目标要求: 掌握: 抽样误差——标准误的意义、计算方法和应用,常用t检验的方法,完全随机设计的方差分析的计算 熟悉: 计量资料的统计推断、总体均数可信区间的估计和假设检验的步骤,t检验的注意事项,随机区组设计的方差分析,Ⅰ型错误,Ⅱ型错误, 了解: 假设检验的意义, t分布,多个样本均数的两两比较 第一节 均数的抽样误差 抽样研究的目的就是要用样本信息来推断总体特征。由于存在变异,样本均数往往不等于总体均数?,因此抽样后各个样本均数也往往不等于总体均数,且各个样本均数间也不一定都相等。这种由抽样造成的样本均数与总体均数的差异或各样本均数之间的差异称为抽样误差,抽样误差是不可避免的。 结论2 的分布很有规律,围绕着?,中间多,两边少,左右基本对称; 样本均数的变异范围较之原变量的变异范围大大缩小; 中心极限定理(central limit theorem) (一)从均数为?、标准差为? 的正态总体中,独立随机抽取例数为n的样本,样本均数 的分布服从正态分布; ■样本均数的均数为 μ; ■样本均数的标准差为 。 可信区间与容许区间的区别 (1)可信区间 用于估计总体参数,总体参数只有一个; 容许区间 用于估计变量值的分布范围,变量值可能很多甚至无限,95%容许区间的涵义是指有95%的变量值在该范围内。 (2)可信区间 所基于的t分布是统计量的抽样分布,一般均可通用; 容许区间 所基于的正态分布是变量值的分布,只有当分布
文档评论(0)