- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计数据的述
第 2 章 统计数据的描述 2.1 统计数据的整理 2.2 分布集中趋势的测度 2.3 分布离散程度的测度 2.4 分布偏态与峰态的测度 2.5 统计表与统计图 学习目标 1. 了解数据的计量尺度 2. 了解统计数据的来源和数据的质量要求 3. 掌握数值型数据的整理与显示方法 4. 掌握数据集中趋势和离散程度的测度方法 5. 掌握茎叶图和箱线图的制作方法 6. 掌握分布集中趋势的测度方法 7. 掌握分布离散程度的测度方法 组距分组 (要点) 1. 将变量值的一个区间作为一组 2. 适合于连续变量 3. 适合于变量值较多的情况 4. 需要遵循“不重不漏”的原则 5. 可采用等距分组,也可采用不等距分组 组距分组(步骤) 1. 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的 2. 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 3. 统计出各组的频数并整理成频数分布表 组距分组(几个概念) 1. 下限(low limit) :一个组的最小值 2. 上限(upper limit) :一个组的最大值 3. 组距(class width) :上限与下限之差 4. 组中值(class midpoint) :下限与上限之间的中点值 次数分配表 直方图(histogram) 1. 用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布 2. 在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图 3. 直方图下的总面积不等于1 折线图(frequency polygon) 1. 折线图也称频数多边形图 2. 是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉 3. 折线图的两个终点要与横轴相交,具体的做法是 第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴 折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的 1. 本世纪初美国经济学家、统计学家洛伦茨(M.E. Lorentz)根据意大利经济学家巴雷特(V. Pareto)提出的收入分配公式绘制成 2. 描述收入和财富分配性质 的曲线分析该国家或地区 分配的平均程度 1. 20世纪初意大利经济学家基尼(G. Gini)根据洛伦茨曲线给出了衡收入分配平均程度的指标 2. A表示实际收入曲线与绝对平均线之间的面积 3. B表示实际收入曲线与绝对不平均线之间的面积 4. 如果A=0,则基尼系数=0,表示收入绝对平均 5. 如果B=0,则基尼系数=1,表示收入绝对不平均 6. 基尼系数在0 和1之间取值 7. 一般认为,基尼系数若小于0.2,表明分配平均;基尼系数在0.2至0.4之间是比较适当的,即一个社会既有效率又没有造成极大的分配不公;基尼系数在0.4被认为是收入分配不公平的警戒线,超过了0.4应该采取措施缩小这一差距。 众数(mode) 1. 一组数据中出现次数最多的变量值 2. 适合于数据量较多时使用 3. 不受极端值的影响 4. 一组数据可能没有众数或有几个众数 5. 主要用于分类数据,也可用于顺序数据和数值型数据 中位数(median) 1. 排序后处于中间位置上的值 中位数(位置的确定) 【例】 9个家庭的人均月收入数据 原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9 【例】:10个家庭的人均月收入数据 排 序: 660 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9 10 四分位数(quartile) 1. 排序后处于25%和75%位置上的值 【例】:9个家庭的人均月收入数据 原始数据: 1500 750 780 1080 85
文档评论(0)