- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 2 章 统计数据的描述2.1统计数据的整理2.2分布集中趋势的测度2.3分布离散程度的测度2.4分布偏态与峰态的测度2.5统计表与统计图学习目标了解数据的计量尺度了解统计数据的来源和数据的质量要求掌握数值型数据的整理与显示方法掌握数据集中趋势和离散程度的测度方法掌握茎叶图和箱线图的制作方法掌握分布集中趋势的测度方法掌握分布离散程度的测度方法2.1 统计数据的整理一、统计数据的分组 二、次数分配三、次数分配直方图四、洛伦茨曲线统计数据的分组组距分组 (要点)将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况需要遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组组距分组(步骤)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数统计出各组的频数并整理成频数分布表 下限值+上限值组中值 =2组距分组(几个概念)1. 下限(low limit) :一个组的最小值2. 上限(upper limit) :一个组的最大值3. 组距(class width) :上限与下限之差4. 组中值(class midpoint) :下限与上限之间的中点值次数分配表的编制(例题分析)【例】某车间30名工人每周加工某种零件件数如下表试对数据进行分组。 次数分配表次数分配直方图直方图(histogram)用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图直方图下的总面积等于1分组数据的图示(直方图的绘制)某车间工人周加工零件直方图 折线图(frequency polygon)折线图也称频数多边形图是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的分组数据的图示(折线图的绘制)折线图与直方图下的面积相等!某车间工人周加工零件折线图 洛伦茨曲线AB洛伦茨曲线本世纪初美国经济学家、统计学家洛伦茨(M.E. Lorentz)根据意大利经济学家巴雷特(V. Pareto)提出的收入分配公式绘制成描述收入和财富分配性质 的曲线分析该国家或地区 分配的平均程度 累积的收入百分比 绝对公平线 累积的人口百分比 AB基尼系数 20世纪初意大利经济学家基尼(G. Gini)根据洛伦茨曲线给出了衡收入分配平均程度的指标 A表示实际收入曲线与绝对平均线之间的面积B表示实际收入曲线与绝对不平均线之间的面积如果A=0,则基尼系数=0,表示收入绝对平均如果B=0,则基尼系数=1,表示收入绝对不平均基尼系数在0 和1之间取值一般认为,基尼系数若小于0.2,表明分配平均;基尼系数在0.2至0.4之间是比较适当的,即一个社会既有效率又没有造成极大的分配不公;基尼系数在0.4被认为是收入分配不公平的警戒线,超过了0.4应该采取措施缩小这一差距。 2.2 分布集中趋势的测度一、众数二、中位数三、分位数四、均值五、几何平均数六、切尾均值七、众数、中位数和均值的比较众数众数(mode)一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据中位数50%50%Me中位数(median)排序后处于中间位置上的值不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用于分类数据各变量值与中位数的离差绝对值之和最小,即中位数(位置的确定)原始数据:顺序数据:数值型数据的中位数 (9个数据的算例)【例】9个家庭的人均月收入数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排 序:750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9?中位数 ? 1080数值型数据的中位数 (10个数据的算例)【例】:10个家庭的人均月收入数据排 序: 660 750 780 850960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8
文档评论(0)