第2章调查与统计数据20130203.ppt

第2章调查与统计数据20130203

第五节 偏态与峰度 一、偏态及其测定 指分布数列的不对称性。 非对称的,偏斜的分布 对称的、高度适中的分布 既偏斜又低平的分布 偏态系数小于0,平均数在众数之左,是一种左偏分布,又称负偏。 左偏分布 偏态系数大于0,平均数在众数之右,是一种右偏分布,又称为正偏。 右偏分布 (一)皮尔逊偏态测定法 Pearson偏态系数是根据众数、中位数与均值各自的性质,通过比较众数或中位数与均值来衡量偏斜度的。 皮尔逊偏态系数计算公式 其中:SKP—皮尔逊偏态测定值; Mo —众数; σ—标准差; . -3≤SKP≤3,其绝对值越大表示偏斜程度越大 反之,表示偏斜程度越小。 . 偏态系数=0为对称分布 . 偏态系数 0为右偏分布 . 偏态系数 0为左偏分布 【例】对下表给出的某公司员工月工资数据,计算偏态系数SKP。 月工资x(元) 职工人数(人) 800 1000 1200 1500 2000 2500 4 8 15 13 6 4 合计 50 解: 由此可知,此公司员工月工资数据分布略微向右偏斜,或称正偏态。 所以,偏态系数 SKP= 因为 , , Mo=1200 鲍雷偏态系数计算公式 其中:SKP— 鲍雷偏态测定值; -1≤SKP≤1 Me —中位数; Q i —四分位数的第i个值(i=1,2,3); (二)鲍雷(BowLey)偏态测定法 鲍雷偏态系数是利用四分位数的关系来测定偏态的一种方法。 动差法偏度的计算: 一阶中心矩衡为零,偶数阶中心矩为正数,奇数阶中心矩可以反映分布偏度。 三阶中心矩有计量单位,不便于比较,故用具有相同单位的?3相除,去掉单位 (三)动差法测定偏态系数 二、峰度及其测定 峰度指数据分布图形的尖峰程度。 扁平分布 尖峰分布 与标准正态分布比较   峰度(qurtosis):描述数据分布峰态的指标,也是度量数据分布集中程度的指标。 β 其中:β— 峰度系数; ? —标准差; υ4—四阶中心矩;             在正态分布情况下: 因此有: 高峰态 低峰态 -4 -3 -2 -1 0 1 2 3 4 4kg 2kg 作用力 力臂   统计动差(矩):利用力的动差来反映数据分布特征的指标。它以次数 f 为作用力,以变量x 为力臂,并以总次数为单位计算平均动差。        称为随机变量 x 对a 的 k 阶矩(动差)。 令a=0,则称为 k 阶原点矩 ?k 令a= ,则称为 k 阶中心矩 ?k 常用的矩: 数值 1 2 3 4 5 6 7 8 9 合计 1组次数 0 0 3 4 4 4 3 0 0 18 2组次数 0 1 1 3 8 3 1 1 0 18 3组次数 1 0 0 0 16 0 0 0 1 18 【例】对下表给出的数据,分别计算峰度系数。 三组资料的平均数都是5,标准差都是1.33,偏态系数都是0,将三组资料绘制成图,如下图: 解: 把上表代入公式计算,得到第一组的四级动差(四阶中心矩)为 同样方法可得2组资料之 ; 第3组资料之 结果大于3,说明分布比正态分布尖锐,结果小于3则表示相对于正态分布平坦的分布。 1. 数据分布扁平程度的测度; 2. 峰度系数=3, 扁平程度适中; 3. 峰态系数3, 为扁平分布; 4. 峰态系数3, 为尖峰分布; 5 .当方差不变时,峰度值越大, 数据会更向均值靠拢,从而分 布曲线的峰度就越高越窄。 6 .不同方差总体间比较峰度无意义。 峰度系数的总结: (三)中位数、众数和算术平均数的关系 c.左偏分布 均值 中位数 众数 b.右偏分布 众数 中位数 均值 1、运用中位数、众数、算术平均数的数量关系判断总体分布特征。 a.对称分布 均值 = 中位数 = 众数 2、利用位置平均数与算术平均数的关系进行推算。 若分布偏斜程度不大,算术平均数、中位数、众数存在一定的比例关系,即: 由此可推出以下三个公式: (四)分位数 1、四分位数 将总体各单位标志值按大小顺序排列后,用三个点或三个数值将数列分成四个等份,这三个点

文档评论(0)

1亿VIP精品文档

相关文档