卫生学9数值变量资料的统计分析.ppt

  1. 1、本文档共106页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
卫生学9数值变量资料的统计分析

第九章 数值变量资料的统计分析 预防医学教研室 郭怀兰 hlanig@yahoo.cm.cn 数值变量资料的统计分析 集中趋势 统计描述 离散趋势 统计推断 内 容 数值变量资料的统计描述 正态分布及其应用 数值变量资料的统计推断 第一节 数值变量资料的统计描述 内容 案例 2007年9月份我室对我校2005级临床本科的1、2、3大班全体学生490人的个人情况(姓名、性别、年龄、身高、体重、吸烟、饮酒等)进行了调查,下面是调查资料问: (1)各变量是什么类型的变量? (2)如何描述2005级临本身高、体重? 一、数值变量资料的频数分布 例9-1??? 某地140名健康成人男性尿素氮(BUN)浓度测定值资料如下: 6.00 5.28  …… 2.10 …… 6.55 …… 编制频数分布表步骤 频数分布表的用途 分布特征 二、集中趋势的描述 描述数值变量资料的集中趋势,常用的指标是平均数(average)。 平均数可用来反映一组性质相同的观察值的集中趋势、中心位置或平均水平。 平均数包括算术均数、几何均数、中位数、众数及调和均数等,是统计学中应用最广泛、最重要的指标体系。 (一)算术平均数 arithmetic mean 算术平均数的计算 1)直接法 将所有数据       直接相加,再除以总例数n,即: 2)加权法  当资料有较多相同观察值时,可用相同观察值的个数(即频数)乘以该观察值,以代替逐个相加。即: 根据表9-2,用加权法求某地健康成人男性BUN(mmol/L)测定值均数如下:   由频数表求得的均数与直接由原始数据求得的均数稍有出入。 二、几何均数 geometic mean 对所有数据直接相乘,再开n次根,即: 应用G时注意事项 计算几何均数时,观察值中不能有0,因为0不能与其他任何数值呈倍数关系 观察值中不能同时有正值和负值。若全是负值,计算时可先将负号除去,得出结果后再加上负号 同一资料而言,若同时计算G与 ,则理论上可以证明G≤ 三、中位数 Median 例9-7 为了解某地儿童体内铅负荷现状,某市儿保所2006年以随机抽样的方法调查了该市340名7岁以下儿童的血铅含量,求其中位数、P25、P75、P95。 应用M时注意事项 对同一资料同时计算M与 ,若资料为对称分布,则M =  ;若资料为单峰正偏态,则M  ;若资料为单峰负偏态,则M M只受位次居中的观察值的影响,对两端极大或极小值均不敏感 计算中位数时,不要求频数表的所有组距相等 百分位数的用途 描述一组资料在某百分位置的水平 应用百分位数注意事项 分布中部的百分位数较稳定,具有较好的代表性,但靠近两端的百分位数,只有在样本含量足够大时才比较稳定,因此,当样本含量不够大时,不宜取太近两端的百分位数 一、全距(range,R) 二、四分位数间距(quartile interval,Q) 例9-8 以例9-2中10名12岁女孩身高数据为例,求标准差 ∑X=1422.1 ∑X2=202924.37 (3)标准差与方差的用途 1 衡量一组观察值的离散程度(变异度),且结合均数可以全面描述正态分布资料的分布特征 2 在两组(或几组)资料均数相近、度量单位相同的情况下,可以衡量样本均数的代表性。标准差越大,表示观察值的变异度越大,均数的代表性越差;反之,标准差越小,表示观察值的变异度越小,均数的代表性越好 3 计算医学参考值范围及计算均数的标准误 四、变异系数(coefficient of variation) 第二节 正态分布和医学参考值范围 正态分布曲线:  指高峰位于中央(均数所在处)、两侧逐渐降低且左右对称、不与横轴相交的光滑的曲线。 例9-12 利用例9-7的资料计算7岁以下男童血铅95%的参考值范围 单侧上限 P95=2.54 应用正态统计理论或百分位数法估计医学正常值时一定要防止绝对化,必须知道 的范围只包括95%的正常人群,必然会有5%的健康者被遗漏;用 确定的医学正常值范围仍有1%健康者被遗漏。因此在临床实践中应根据各方面情况综合考虑,防止漏诊或误诊。 复习思考题 1.描述集中趋势的指标; 2.描述离散趋势的指标; 3.正态分布特征; 4.正态分布曲线下面积的分布规律。 课后题 请表9-2的资料,计算成年男性BUN大于5.68的人有多少? 参考值范围的制定

文档评论(0)

sandaolingcrh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档