- 1、本文档共59页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
02、数值变量的统计描述PPT
第二章 数值变量资料的统计描述;First;Second;Third;第一节 频数分布;;2000年某地区100名2岁健康男童身高的频数分布 ;用SPSS软件绘制频数表 ;组段 ;频数;揭示资料的分布特征和分布类型;
频数分布的两个重要特征:集中趋势和离散趋势
频数分布可分为对称分布和偏态分布
便于发现可疑值;
便于进一步计算指标和统计分析处理;第二节 数值变量资料的描述指标 ;描述集中趋势的指标 ——平均数 average ;计算方法
1.直接法
2.加权法 ;某地区100名2岁健康男童身高均数的计算 ;;均数的应用:
适用于对称分布资料,因为这时均数位于分布的中心,最能反映分布的集中趋势。
对于正态分布资料,均数更有其重要作用。;几何均数(geometric mean)
用符号G表示
适用条件:常用于等比资料(如抗体滴度资料、医疗费用、人口增长等),尤其是对数正态资料。
;计算方法:
1. 直接法:
2. 加权法:;例 5人的血清滴度为 1:2, 1:4, 1:8, 1:16,
1:32, 求平均滴度。;抗体滴度;故平均滴度为1:4 ;应用
常用于呈等比数列的资料,即变量值呈倍数关系,尤其适用于对数正态分布的资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布。
计算几何均数时应注意:
1. 观察值中不能有0;
2. 观察值不能同时有正值和负值,若全是负值,计算时可把负号去掉,得出结果后再加上负号。;中位数 median ;计算:
1. 直接法(小样本资料):
将观察值按大小顺序排列
n为奇数时
n为偶数时
2.频数表法(大样本资料或频数表资料):
;0;;潜伏期
(小时);中位数的应用;描述离散趋势的指标;全距(range)
亦称极差,用符号R表示,是一组观察值中最大值与最小值之差。
反映个体差异的范围:极差大,变异程度大;极差小,变异程度小。
优点:计算简单,意义明了。
缺点:
1. 只反映两个极端值之差;
2. 不稳定。;四分位数间距(quartile range)
用符号Q表示
四分位数(quartile):
第25百分位数P25——下四分位数QL
第75百分位数P75——???四分位数QU
四分位数间距Q= QU – QL
反映中间一半观察值的极差
优点:计算简单,比极差稳定
缺点:仍然没考虑全体观察值的变异,
仍然不够稳定。;方差(variance)
总体方差——σ2
样本方差——s2
方差越大,变异越大;反之亦然。
优点:考虑了所有观察值的变异,比较稳定。
缺点:量纲(即单位)发生了改变。;标准差(standard deviation)
总体标准差——σ
样本标准差——s
;计算
1. 直接法
2. 加权法
;例 计算甲乙两组数据的标准差。
甲组: n=5,?X=4+5+6+7+8=30
?X2= 42+52+62+72+82=190
?
乙组:n=5,?X=2+4+6+8+10=30
?X2= 22+42+62+82+102 =220
; 某地100名2岁健康男童身高标准差计算;;意义:
标准差全面反映了一组观察值的变异程度,两组观察值在单位相同,均数相近的条件下,标准差大说明这组观察值的变异较大,即观察值围绕均数分布较离散,均数的代表性差;反之,说明各观察值多集中在均数周围,均数的代表性好。
; 应用
(1)表示观察值的变异程度;
(2)计算变异系数;
(3)计算标准误;
(4)结合均数描述正态分布特征;
(5)根据正态分布原理,应用于求正
常值范围。;变异系数(coefficient of variation)
亦称离散系数,用符号CV表示。
特出优点:没有单位,便于比较。
适用于:
1. 比较单位不同的多组资料的变异程度
2. 比较均数相差悬殊的多组资料的变异
程度。; 例 研究得到100名2岁健康男童身高均数为84.8
文档评论(0)