《商务统计学》4.4数据离中趋势.ppt

数据离中趋势 1. 全距与四分差 方差与标准差 离散系数 离中趋势 数据分布的另一个重要特征 反映各变量值远离其中心值的程度(离散程度) 从另一个侧面说明了集中趋势测度值的代表程度 全距(range) 一组数据的最大值与最小值之差 离散程度的最简单测度值 易受极端值影响 未考虑数据的分布 计算公式为:R = Max(xi) - Min(xi) 四分位差 也称为内距或四分间距 上四分位数与下四分位数之差: Qd = QU– QL 反映了中间50%数据的离散程度 不受极端值的影响 25% 75% 方差和标准差 数据离散程度的最常用测度值 反映各变量值与均值的平均差异 通常记为s2、s 方差和标准差 未分组数据 组距分组数据 未分组数据 组距分组数据 方差的计算公式 标准差的计算公式 分子为n-1 自由度(degree of freedom) 自由度的概念由统计学家R.A Fisher提出 是指数据个数与附加给独立的观测值的约束或限制的个数之差 从字面涵义来看,自由度是指一组数据中可以自由取值的个数 当样本数据的个数为n时,若样本平均数确定后,则附加给n个观测值的约束个数就是1个,因此只有n-1个数据可以自由取值,其中必有一个数据不能自由取值 按着这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k 方差和标准差 【例】为了解淘宝双十一购物节顾客消费的情况,阿里巴巴集团数据分析部门随机抽取了100名顾客的消费额数据,据此计算顾客消费额的方差和标准差。 方差和标准差 730 754 801 721 864 805 718 768 828 808 735 830 798 809 894 809 801 811 812 811 830 760 853 766 756 866 865 829 794 785 868 880 815 842 778 710 838 820 791 759 745 790 815 821 824 702 722 818 836 751 812 792 724 893 859 876 727 841 783 841 776 843 829 734 782 823 762 791 806 817 810 820 812 786 803 895 792 782 764 820 815 741 815 761 817 817 791 758 825 829 810 821 774 806 744 808 828 785 784 800 表 淘宝双十一购物节顾客消费额数据 方差和标准差 解 方差和标准差 VAR函数、STDEV函数的功能是返回一组抽样数据的方差、标准差。语法结构为: VAR(number1,[number2],…) STDEV(number1,[number2],…) 其中, number1,[number2] ,...,是用来计算中位数的数值、单元格引用或单元格区域。 解 离散系数 离散系数是一组数据分布离中趋势的绝对测度值与其相应的算术平均数之比 离散系数 全距系数: 四分位差系数: 标准差系数: 离散系数 【例】一服装制造企业员工的平均月产量为300件,标准差为18件。另有一食品加工企业员工的平均月产量为5000千克,标准差为500千克。判断两个企业中哪家企业员工的平均月产量代表性好? 解 食品企业员工月产量标准差系数: 服装企业员工月产量标准差系数: 由于服装企业员工的月产量标准差系数小于食品企业员工的月产量标准差系数,所以服装企业员工的平均月产量代表性较好。 小 结 全距与四分差 方差与标准差 离散系数 思考练习 利用淘宝双十一购物节顾客消费额的频数分布数据计算方差和标准差。 * * * * * * * * * * * *

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档