统计描述及正确应用.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计描述及正确应用

统计描述的正确应用 张菊英 教授 四川大学华西公共卫生学院 一、定量资料的统计描述 定量变量 关注测定值的大小 定量资料的统计描述 主要内容: 定量资料的频数表 集中位置的统计描述 离散程度的统计描述 1.定量资料的频数表和频数分布图 揭示频数分布的特征:集中趋势、离散程度 揭示频数分布的类型:对称分布、偏态分布 便于进一步计算指标和统计处理 便于发现某些特大或特小的可疑值 1.1离散型定量变量的频数表 表1.1 2005年某市102名高中男生引体向 上 完成次数的频数分布 1.2 连续型定量变量的频数表 表1.2 2005年某市120名9岁男孩肺活量(L)频数分布 1.3 频数分布图 用图形的方法能够直观形象地表达频数分布的信息,并可与频数表互为补充 连续型定量变量的频数表可绘制成直方图 2.集中位置的统计描述 集中趋势(central tendency) 一组数据向某一个位置聚集或集中的倾向 集中位置用平均数描述 2.1 均数与中位数 均数(mean) 适用条件:对称分布,特别是正态或近似正态分布的定量资料。 中位数(median,M ) 适用条件:偏态分布资料以及频数分布的一端或两端无确切数据资料 。 某市1974年留驻该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人的发汞值(μmol/kg)检测结果如表1.3的第1和3列所示。 均数与中位数 表1.4 不同级别医院费用比较( ,元) 例 某实验室观察局部温热治疗小鼠移植性肿瘤的疗效,以生存日数(天)作为观察指标,共观察10只老鼠的生存日数(天)为:10,12,15,15,16,17,18,20,23,90。试描述10只老鼠生存日数的平均水平。 2.2 几何均数(geometric mean) 适用条件:某些呈正偏态分布,但数据经过对数变换后呈正态分布的资料,也可用于观察值之间呈倍数或近似倍数变化(等比关系)的资料。 几何均数的应用 3. 离散程度的统计描述 离散度指标反映一组同质观察值的变异度; 常用的指标有全距、四分位数间距、方差、标准差和变异系数; 其值越大,表示资料的变异程度越大。 3.1 极差(range,简记为R) 涵义:也称全距,即全部数据中最大值与最小值之差,用符号表示。极差大,说明变异程度大。 适用条件:常由于描述单峰对称分布小样本资料的变异程度或由于初步了解资料的变异程度。 缺点:只考虑最大值与最小值之差异,不能反映组内其它观察值的变异度; 例 试观察三组数据的离散状况 A组:26,28,30,32,34; B组:24,27,30,33,36; C组:26,29,30,31,34。 将三组数据分别点在直线上,如图: 3.2 百分位数(percentile) 涵义:是指将观察值从小到大排列后处于第x百分位置上的数值,用符号表示为 百分位数是一个位置指标,其中P50为中位数 3.3 四分位数间距 四分位数(quartile,简记为Q) 通过P25,P50,P75这3个点将全部观察值等分为四部分,处于P25和P75分位点上的数值就是四分位数 P25下四分位数,用 表示 P75上四分位数,用 表示 四分位数间距(inter-quartile range)为上、下四分位数之间的差值,即 四分位数间距的适用条件 常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。 某研究者在“清醒状态下大鼠脑震荡动物模型的建 立”一文中,给出了如下的资料,请问:这样表达妥 当么? 例 50例链球菌咽峡炎患者的潜伏期(小时)如下表第(1)~(3)列, 优缺点 四分位数间距较全距稳定,但仍未考虑全部观察值的变异度。 3.4方差和标准差 为了全面考虑每个观察值的变异情况,克服全距和四分位数间距的缺点,引入了方差 。 方差的单位是观察值单位的平方,在实际工作中使用不方便,为还原单位,将方差开平方即得到标准差(standard deviation)。总体标准差用 表示,样本标准差用S 表示。 方差和标准差的适用条件 正态或近似正态分布资料 变异系数(coefficient of variation) 简记为CV 适用: 比较计量单位不同的几组资料的离散程度 比较均数相差悬殊的几组资料的离散程度 例 1985年通过十省调查得知,农村刚满周岁的女童体重均数为8.42kg,标准差为0.98kg;身高均数为72.4cm,标准差为3.0

文档评论(0)

ipbohn97 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档