- 9
- 0
- 约9.53千字
- 约 76页
- 2018-06-28 发布于湖北
- 举报
数据的概括性度_量统计学
偏态(skewness) 统计学家Pearson于1895年首次提出 数据分布偏斜程度的测度:偏态系数 (SK) 偏态测定方法: 皮尔逊(Pearson)法 宝勒(Bowley)法 第三动势法 * 皮尔逊(Pearson) 偏态测定法 宝勒(Bowley)偏态测定法 * 第三动势偏态测定法 目前最常用的方法 根据原始数据计算 根据分组数据计算 * 偏态系数 (skewness coefficient) 偏态系数SK=0 为对称分布 偏态系数SK0 为右偏分布 偏态系数SK0 为左偏分布 偏态系数大于1或小于-1,被称为高度偏态分布;偏态系数在0.5~1或-1~-0.5之间,被认为是中等偏态分布;偏态系数越接近0,偏斜程度就越低 * 偏态系数 (例题分析) 某电脑公司销售量偏态及峰度计算表 按销售量份组(台) 组中值(Mi) 频数 fi 140—150 150—160 160—170 170—180 180—190 190—200 200—210 210—220 220—230 230—240 145 155 165 175 185 195 205 215 225 235 4 9 16 27 20 17 10 8 4 5 -256000 -243000 -128000 -27000 0 17000 80000 216000 256000 6250007290000 2560000 270000 0 170000 1600000 648000031250000 合计 — 120 540000 * 偏态系数 (例题分析) 结论:偏态系数为正值,但与 0 的差异不大,说明电脑销售量为轻微右偏分布,即销售量较少的天数占据多数,而销售量较多的天数则占少数 * 偏态与峰态(从直方图上观察) 频 数 (天) 25 20 15 10 5 30 结论:1. 为右偏分布 2. 峰态适中 某电脑公司销售量分布的直方图 按销售量分组(台) 140 150 160 170 180 190 200 210 220 230 240 * 峰态(kurtosis) 统计学家Pearson于1905年首次提出 数据分布扁平程度的测度:峰态系数(K) 根据原始数据计算 根据分组数据计算 * 峰态系数 (kurtosis coefficient) 峰态系数K=0 为峰度适中 峰态系数K0 为扁平分布 峰态系数K0 为尖峰分布 * 峰态系数 (例题分析) 结论:偏态系数为负值,但与0的差异不大,说明电脑销售量为轻微扁平分布 * 用Excel计算描述统计量 ?将120天的销售量的数据输入到Excel工作表中,然后按下列步骤操作: 第1步:选择“工具”下拉菜单 第2步:选择“数据分析”选项 第3步:在分析工具中选择“描述统计”,然后选择“确定” 第4步:当对话框出现时 在“输入区域”方框内键入数据区域 在“输出选项”中选择输出区域 选择“汇总统计” 选择“确定” 实例计算 * 数据分布特征和描述统计量 数据分布特征 集中趋势 离散程度 分布形状 中位数 平均数 异众比率 四分位差 极差 偏态系数 平均差 方差或标准差 峰态系数 众数 离散系数 * 本章小节 1. 数据水平的概括性度量 2. 数据离散程度的概括性度量 数据分布形状的测度 用Excel计算描述统计量 * 众数、中位数和均值的特点和应用场合 众数 不受极端值影响 具有不唯一性 数据分布偏斜程度较大且有明显峰值时应用 中位数 不受极端值影响 数据分布偏斜程度较大时应用 平均数 易受极端值影响 数学性质优良 数据对称分布或接近对称分布时应用 * 数据类型与集中趋势测度值 数据类型和所适用的集中趋势测度值 数据类型 分类数据 顺序数据 间隔数据 比率数据 适 用 的 测 度 值 ※众数 ※中位数 ※均值 ※均值 — 四分位数 众数 调和平均数 — 众数 中位数 几何平均数 — — 四分位数 中位数 — — — 四分位数 — — — 众数 * 4.2 离散程度的度量 分类数据:异众比率 顺序数据:四分位差 数值型数据:方差及标准差 相对离散程度:离散系数 * 离中趋势 数据分布的另一个重要特征 反映各变量值远离其中心值的程度(离散程度) 从另一个侧面说明了集中趋势测度值的代表程度 不同类型的数据有不同的离散程度测度值 * 异众比率(variation ratio) 1. 对分类数据离散程度的测度 2. 非众数组的频数占总频数的比率 计算公式为 4. 用于衡量众数的代表性 * 异众比率 (例题分析) 不同品牌饮料的频数分布 饮料品牌 频数
原创力文档

文档评论(0)