第二讲 定量资料的统计描述PPT.ppt

第二讲 定量资料的统计描述PPT

计量资料的统计描述;统 计 描 述;主要内容;(一)、频数分布表的编制 ;某儿研所测得该地150名12岁健康男童体重(kg)原始数据如下,试编制频数表。;2.按极差大小决定组段数、组段和组距。 ;划分组段:各组段应有明确的界限,便于汇总,每个组段的起点称“下限”,终点称“上限”。 第一组段必须包括最小值,一般取略小于最小值的整数作为第一组的下限,但是第一组的下限值不能等于最小值。 各组段即不重叠,也不能留空隙,所以每一组段均为半开闭区间,后一组的下限就是前一组的上限。 组段中的横线~不能省略,它表示连续型资料。 最后一个组段应该包括最大值,并且封口,但最后一个组段的上限不能等于最大值。; 本例最小值为20.1,故取20为第一组的下限。 第二组下限即20+3=23,余类推。 最后一个组段为50~53,包括最大值51.2。 3.列表划记,统计各组段频数。 4.计算频率与累计频率;;频数分布的两个特征;频数分布的类型 ; 某地150名12岁男童体重频数分布图 ;频数分布的类型;120例链球菌感染咽炎患者潜伏期分布图(正偏峰分布) ;一些慢性病患者的年龄分布,其集中位置偏向年龄大的一侧,频数尾部向左侧延伸,称为负偏态(峰)分布,如下图: ;207例某恶性肿瘤患者年龄分布(负偏峰分布) ;频数表的用途 ;(二)、集中趋势指标 ;1、均数(mean);均数的计算;均数的计算;均数的计算;均数的两个重要特征 ;均数的应用 ;2、几何均数(geometric mean,G);几何均数的应用;3、中位数(M)和百分位数(P);中位数计算方法:直接法;中位数计算方法:频数表法;中位数和百分位数的应用 ;(三)、离散程度指标;离散趋势即个体值之间的变异程度,数据越分散,变异程度越高。 极差 四分位数间距 方差 标准差 变异系数;1、极差(range,R);2、四分位数间距(quartile range ,QR);极差R 四分位数间距QR 离均差(x-μ) 离均差总和?(x??)=0 离均差绝对值和?|x??| 离均差平方和?(x??)2 均方(方差)σ2=?(x??)2/N 标准差 ;但是在实际工作中,总体方差往往是未知的,常用样本方差s2来估计。在公式中,用 代替?,用n代替N,这时计算的结果往往比总体方差σ2??小,所以分母用n-1来代替N,即公式变为: 这时样本方差s2是总体方差σ2的无偏估计。 N-1:自由度,常用ν或df表示,是指随机样本研究中,可独立地随机选择变动的观测值的个数。;三组同性别、同年龄儿童的体重(kg)如下,分析其集中趋势与离散趋势。 甲组 26 28 30 32 34 甲=30kg R=8 S=3.16 乙组 24 27 30 33 36 乙=30kg R=12 S=4.74 丙组 26 29 30 31 34 丙=30kg R=8 S=2.91 丙组数值的代表性好。 ;标准差的应用;4、变异系数(CV) ;小 结 ;百分位数描述观察序列在某百分位置的水平,它是分布的百分界值,可用于确定医学参考值范围,适用于任何分布。 描述频数分布离散程度的指标有: 方差与四分位间距,后者较稳定,但均不能综合反映各观察值的变异程度; 方差和标准差,最为常用,对正态及近似正态分布尤为重要; 变异系数,可用于资料度量单位不同或均数相差悬殊时变异度的比较。 ;; Analyze Descriptive Statistics(统计描述) Frequencies(频数分布分析) Descriptive(描述性统计分析) Explore(探索性分析);统计描述;频数分布分析; 频数分布分析 Frequencies;数据格式: n行1列 ; Analyze →Descriptive Statistics →Frequencies ;变量名;Statistics对话框 ;Charts(统计图)对话框 ;点击“OK”,运行结果;;基本统计量;;频数表;直方图; 数据格式: n行1列 ;Analyze→Descriptive Statistics→Descriptives ;Descriptives对话框 ;Options对话框 ;点击“OK”,运行结果;结果输出;基本统计量;;Analyze →Descriptive Statistics→ Explore ;Explore对话框;Statistic 对话框;Plots对话框;点击“OK”,运行结果; 结果输出;资料缺失数据描述;基本

文档评论(0)

1亿VIP精品文档

相关文档