; 统计描述
用统计表、或统计图、或统计指标(描述统计量)概括和揭示资料(data)的数量信息和特征。
目的使资料简洁、明了,便于大致了解资料的数量规律。;一、频数分布表和频数分布图;检查次数; 频数(frequency):重复某随机试验,某随机事件出现的次数,称为频数。
频数分布表(frequency distribution table) 简称频数表(frequency table):
有组段与频数的统计表,称频数表。
;2、连续型定量变量的频数分布
1)何为连续型定量变量?
2)其与离散型定量变量有何区别?
3)连续型??量变量的频数分布表该如何绘制?
;例2-2 抽样调查某地120名18岁到38岁健康男性居民血清铁含量(umol/L),数据如下。试编制血清铁资料的频数分布表。;组段;连续型定量变量频数表的编制方法:
1)计算全距(range , R)
R=最大值 - 最小值=29、64 - 7、42=22、22
2)确定组段数(K)与组距
如等组距,则 组距 = R / K
3)确定组段、计数归表
;图2-2 120名健康成年男子血清铁含量频数直方图; 0、04;直方图(histogram)
为直观反映频数表,利用直角坐标系绘制频数图,横轴表示变量的“各种情形”,纵轴表示频数、或频率、或频率密度。;潜伏期(小时);图2-4 187例某种沙门氏菌食物中毒潜伏期频数直方图;变量频数分布的类型:
1、对称分布
2、偏态分布:
正偏峰(positive skew )分布(向左偏)
负偏峰 (negative skew) 分布(向右偏);频数分布的两个特征
1、集中趋势(central tendency)(平均水平)
2、离散趋势 (tendency of dispersion)(变异);左撇子更聪明不?;英国有一项研究;平均智商相同,但变异程度(离散)不同。
平均智商相同,但分布不一样。;二、描述定量变量的统计指标
(定量变量的数值特征);1、描述集中趋势的统计指标(平均数 average)
1)算术均数(arithmetic mean),简称均数
2)几何均数(geometric mean, G)
3)中位数(median, M)
4)众数(mode);1)算术平均数(arithmetic mean, mean):
描述对称分布资料的平均水平;月工资x;2)几何平均数 (geometric mean); 假设甲商品今年2月从200元上涨到250元,其价格比为1、25,上涨率为25%;3月份又从250元下降到200元,其价格比为0、8,下降了20%。求该商品2、3月份的平均价格比。; 例 有60人的血清抗体效价,分别为:
7人1:5,11人1:10,22人1:20,12人1:40,8人1:80,求平均抗体效价。
60人的血清平均抗体效价为1:20、705。
;3)中位数(median):可用于各种分布的定量资料。
指总体中有一半个体的数值低于这个数,一半个体的数值高于这个数。关于样本资料,有如下计算公式:
n为奇数时: ; 例: 对某项高风险的新手术术后的生存时间进
行跟踪,共调查7人, 6人死亡之前分别生存了5天,6天,10天,16天,25天,29天,还有一人术后30天随访时仍存活、求7人的平均存活时间?; 关于频数表资料,可用百分位数的方法计算中位数。
; 百分位数(percentile, Px):
对总体来说,它表示总体中数值小于Px个体恰有x%。
对样本来说,它表示在依照升序排列的数列里,小于Px的个体数在整个样本中所占百分比为x%。
显然,中位数就是P50。;某班90人某科程考试成绩;组段; 某班某课程考试成绩直方图;某班某课程考试成绩箱形图;样本百分位的计算公式为:;4)众数(mode):总体中指出现机会最高的数值;
样本众数则是在样本中出现次数最多的数值。
表2-1 1998年某地96名妇女产前检查次数频数分布;算术平均数与中位数的区别与联系
1、都是用来表示总体的一般水平或分布的集中趋势,都属于抽象化的代表值。
2、代表的意义不同:
算术平均数是对所有变量值来计算的平均数,它能概括反映整个数列中每个变量值的平均水平;
中位数则是依照总体中处于中间位置上的少数变量值来确定的代表值。 从这一点来说,算术平均数对数据的概括能力比中位数显然来的更强一些。;3、与中位数相比,算术平均数对数据变化的“灵敏度”特别高。但算术平
原创力文档

文档评论(0)