数值变量资料的统计分析--变异程度的描述资料.ppt

数值变量资料的统计分析--变异程度的描述资料.ppt

作业: 1、标准差与全距、四分位数间距比较,有哪些优点? 2、变异系数在什么情况下应用?它与标准差有什么区别和联系? 举例说明描述计量资料的指标包括集中趋势指标和离散趋势指标。 点明方差即是标准差的平方 点明:标准差是最常用的表示离散趋势的指标。 讲明变异系数的应用条件。分清标准差和变异系数的区别及联系。 巩固课堂知识内容与方法:先对相关重点内容进行理论讲解,主要通过举例说明来讲清标准差的意义及其计算。 离散趋势指标 ( 变异程度的统计描述) ( Measures of Dispersion ) 要求: 掌握:标准差的含义及计算方法;变异系数的计算方法和应用。 熟悉:其他描述离散趋势的常用指标。 离散趋势(dispersion tendency)指标 三组同年龄、同性别儿童的体重(kg) 甲组 26 28 30 32 34 乙组 24 27 30 33 36 丙组 26 29 30 31 34 30 30 30 标准差的意义 标准差是表示一组观察者离散程度或变异程度的统计指标; 描述一个变量的所有观察值与均数的平均离散程度的指标。 全距表示一群变量值的最大值与最小值之差,反映个体差异的范围,用R表示。全距大,说明变异度大;反之,说明变异度小。 甲组 26 28 30 32 34 乙组 24 27 30 33 36 R=8 R=12 一、全距(range) 1.不能全面反映资料的离散程度; 2.不稳定,易受极端值的影响,抽样 误差大。 优点 缺点 1.表示变异范围,简单明了、容易使用,如用于说明传染病、食物中毒等的最短、最长潜伏期等; 2.各种分布类型的资料均可用。 全距(range) 二、四分位数间距 (quartile interval) 四分位数间距是上四分位数(QU=P75)和下四分位数(QL=P25)之差,用Q表示(QU-QL)。该数值越大,说明变异度越大;反之,说明变异度越小。 某地630名正常女性血清甘油三脂含量(mg/dl) 甘油三脂 频数 累计频数 累计频率(%) 0.10~ 27 27 4.3 0.40~ 169 196 31.1 0.70~ 167 363 57.6 1.00~ 94 457 72.5 1.30~ 81 538 85.4 1.60~ 42 580 92.1 1.90~ 28 608 96.5 2.20~ 14 622 98.7 2.50~ 4 626 99.4 2.80~ 3 629 99.8 3.10~ 1 630 100.0 合计 630 - - L: 组段的下限; iM: 组距; fx: 频数; fL: Px所在组段之前的累积频数。 1.与中位数配套,用于偏态分布资料及分布的一端或两端无确切数值的资料; 2.比全距稳定。 未考虑到每个观察值的变异度。 优点 缺点 四分位数间距 (quartile interval) 三、平均差距指标 (一)平均偏差(Mean Difference) 甲班: 乙班: 特点:直观 , 易理解;但由于用了绝对值,不便于数学处理,实际中很少使用。 (二)离均差平方和(Sum of Square,SS) 为了克服平均偏差的缺点,可以不通过取绝对值,而是通过取平方来避免正负抵消,即使用离均差平方和,其计算公式为 SS 通常作为一个中间统计量使用。 (三)方差 (Variance) 方差是将离均差平方和再取平均,即 注意:对于样本资料,分母用的是n-1,称为自由度(degree of freedom,df )。 方差的特点:便于数学上的处理,但由于有平方,度量衡发生变化,不便于实际应用。 方差(variance) 自由度=n-限制条件的个数,用ν表示。 (n-1):当 选定时,n个变量值 中能自由变动的变量值的个数。 方差越大,资料的离散程度越 大(全面考虑了每个观察值); 不受观察值个数的影响。 优点 缺点 一些资料不适用于以平方表示。 方差(variance) 四、标准差 (S

文档评论(0)

1亿VIP精品文档

相关文档