《商务统计学》3.3数值数据整理与图示.pptx

数值数据整理与图示 Applied Statistics 1. 数值数据整理 2. 数值数据图示 数值数据的整理 分组方法 组距分组(关键步骤) 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按 Sturges 提出的经验公式来确定组数K 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 确定各组组限 组距分组(基本概念) 1. 下限(low limit) :一个组的最小值 2. 上限(upper limit) :一个组的最大值 3. 组距(class width) :上限与下限之差 4. 组中值(class midpoint) :下限与上限之间的中点值 组距分组(基本概念) 只有当全部数据中的最大观察值和最小观察值与其他数据相差悬殊,为避免出现空白组(不包含有任何数据的组)或个别极端值被漏掉,第一组和最后一组可以采取“××以下”及“××以上”这样的开口组。开口组的情况下,一般以相邻组的组距作为其组距,使用下面的公式之一计算组中值: 组中值=上限-相邻组组距/2 组中值=下限+相邻组组距/2 组距分组 【例】为了解淘宝双十一购物节顾客消费的情况,阿里巴巴集团数据分析部门随机抽取了100名顾客的消费额数据。编制频数分布表,分析顾客消费额的分布状况。 组距分组 730 754 801 721 864 805 718 768 828 808 735 830 798 809 894 809 801 811 812 811 830 760 853 766 756 866 865 829 794 785 868 880 815 842 778 710 838 820 791 759 745 790 815 821 824 702 722 818 836 751 812 792 724 893 859 876 727 841 783 841 776 843 829 734 782 823 762 791 806 817 810 820 812 786 803 895 792 782 764 820 815 741 815 761 817 817 791 758 825 829 810 821 774 806 744 808 828 785 784 800 表 淘宝双十一购物节顾客消费额数据 组距分组 确定组数:根据 Sturges 提出的经验公式得组数K 为: 确定各组的组距: 组距=( 895 - 702)÷ 10=19.3  20 确定各组组限 组距分组(上、下组限重叠) 消费额(元) 顾客数(名) 频率 百分比/(%) 700~720 3 0.03 3 720~740 7 0.07 7 740~760 8 0.08 8 760~780 9 0.09 9 780~800 15 0.15 15 800~820 26 0.26 26 820~840 17 0.17 17 840~860 6 0.06 6 860~880 5 0.05 5 880~900 4 0.04 4 合计 100 1.00 100 表 淘宝双十一购物节顾客消费额的频数分布表 组距分组(上、下组限间断) 消费额(元) 顾客数(名) 频率 百分比/(%) 700~719 3 0.03 3 720~739 7 0.07 7 740~759 8 0.08 8 760~769 9 0.09 9 780~799 15 0.15 15 800~819 26 0.26 26 820~839 17 0.17 17 840~859 6 0.06 6 860~879 5 0.05 5 880~899 4 0.04 4 合计 100 1.00 100 表 淘宝双十一购物节顾客消费额的频数分布表 组距分组(开口组) 消费额(元) 顾客数(名) 频率 百分比/(%) 700以下 3 0.03 3 720~740 7 0.07 7 740~760 8 0.08 8 760~780 9 0.09 9 780~800 15 0.15 15 800~820 26 0.26 26 820~840 17 0.17 17 840~860 6 0.06 6 860~880 5 0.05 5 880以上 4 0.04 4 合计 100 1.00 100 表 淘宝双十一购物节顾客消费额的频数分布表 组距分组 解 FREQUE

文档评论(0)

1亿VIP精品文档

相关文档