第 4 章 数据的概括性度量 偏态系数 (coefficient of skewness) 根据原始数据计算 根据分组数据计算 偏态系数 (例题分析) 7290000 2560000 270000 0 170000 1600000 648000031250000 540000 -256000 -243000 -128000 -27000 0 17000 80000 216000 256000 625000 120 — 合计 4 9 16 27 20 17 10 8 4 5 145 155 165 175 185 195 205 215 225 235 140 ~ 150 150 ~ 160 160 ~ 170 170 ~ 180 180 ~190 190 ~200 200 ~210 210 ~220 220 ~ 230 230 ~ 240 频数 fi 组中值(Mi) 按销售量份组(台) 某电脑公司销售量偏态及峰度计算表 偏态系数 (例题分析) 结论:偏态系数为正值,但与0的差异不大,说明电脑销售量为轻微右偏分布,即销售量较少的天数占据多数,而销售量较多的天数则占少数 分类数据:异众比率 异众比率(variation ratio) 1. 对分类数据离散程度的测度 2. 非众数组的频数占总频数的比例 3. 计算公式为 4. 用于衡量众数的代表性 异众比率 (例题分析) 解: 在所调查的50人当中,购买其他品牌饮料的人数占70%,异众比率比较大。因此,用“碳酸饮料”代表消费者购买饮料品牌的状况,其代表性不是很好 不同品牌饮料的频数分布 100 1 50 合计 12 20 22 16 30 0.12 0.20 0.22 0.16 0.30 6 10 11 8 15 果汁 矿泉水 绿茶 其他 碳酸饮料 百分比(%) 比例 频数 饮料品牌 顺序数据:四分位差 四分位差(quartile deviation) 对顺序数据离散程度的测度 也称为内距或四分间距 上四分位数与下四分位数之差 Qd = QU – QL 反映了中间50%数据的离散程度 不受极端值的影响 用于衡量中位数的代表性 四分位差 (例题分析) 解:设非常不满意为1,不满意为2, 一般为3, 满意为 4, 非常满意为5 。 已知 QL = 不满意 = 2 QU = 一般 = 3 四分位差为 Qd = QU - QL = 3 – 2 = 1 甲城市 回答类别 — 300 合计 24 132 225 270 300 24 108 93 45 30 非常不满意 不满意 一般 满意 非常满意 累计频数 户数 (户) 甲城市家庭对住房状况评价的频数分布 数值型数据:方差和标准差 极差(range) 一组数据的最大值与最小值之差 离散程度的最简单测度值 易受极端值影响 未考虑数据的分布 R = max(xi) - min(xi) 计算公式为 平均差(mean deviation) 各变量值与其平均数离差绝对值的平均数 能全面反映一组数据的离散程度 数学性质较差,实际中应用较少 计算公式为 未分组数据 组距分组数据 平均差 (例题分析) 2040 160 270 320 270 0 170 200 240 160 250 — 40 30 20 10 0 10 20 30 40 50 120 — 合计 4 9 16 27 20 17 10 8 4 5 145 155 165 175 185 195 205 215 225 235 140~150 150 ~ 160 160 ~ 170 170 ~ 180 180 ~ 190 190 ~ 200 200 ~ 210 210 ~ 220 220 ~ 230 230 ~ 240 频数(fi) 组中值(Mi) 按销售量分组 某电脑公司销售量数据平均差计算表 平均差 (例题分析) 含义:每一天的销售量与平均数相比, 平均相差17台 方差和标准差(variance and standard deviation) 数据离散程度的最常用测度值 反映了各变量值与均值的平均差异 根据总体数据计算的,称为总体方差(标准差),记为?2(?);根
原创力文档

文档评论(0)