- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 3章 统计数据的整理 统计数据的整理 本章小结 学习目标 掌握数值型数据的整理方法 学习重点 统计分组方法 授课学时 2学时 统计数据的分组 按照品质标志分组 按照数量标志分组——单项式分组 组距分组 (要点) 将变量值的一个区间作为一组 适合于连续变量 适合于变量值较多的情况 需要遵循“不重不漏”的原则 可采用等距分组,也可采用不等距分组 按照数量标志分组——组距式分组 某企业职工工资统计表 组距分组(步骤) 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的 确定组距:组距(class width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 统计出各组的频数并整理成频数分布表 组距分组(几个概念) 1. 下限(low limit) :一个组的最小值 2. 上限(upper limit) :一个组的最大值 3. 组距(class width) :上限与下限之差 4. 组中值(class midpoint) :下限与上限之间的中点值 次数分配 将数据按其分组标志进行分组的过程,就是次数分配数列形成的过程。 频数(次数、统计)分布:在统计分组的基础上,把全部数据按组归并排列,形成全部数据在各组间的分布。 在各组中出现的数据个数称为频数或次数。各组频数与全部频数之和的比值称为频率或比重。 次数分布表的编制 步骤:(1)对原始数据按从小到大进行排序,找出最大值和最小值;(2)确定合适的组数和组距;(3)确定组距(等组距和不等组距)和组限(每组上下限)。 原则:(1) 组数的确定应以能够显示数据的分布特征和规律为目的;(2)数据分配遵循“不重不漏”;(3)组限值遵循“上限不再本组内” 等组距:组距相等不等组距:各组组距不相等。 我国人口年龄阶段的分组表 等组距:组距相等不等组距:各组组距不相等。 我国人口年龄阶段的分组表 次数分配表的编制(例题分析) 次数分配表 累计频数与累计频率 使用Excel频数函数 (FREQUENCY) Excel的“直方图”工具的缺陷是:频数分布和直方图没有与数据联系起来,这样,如果你改变任何一个数据,频数分布表和直方图不会跟着改变 使用Excel中的统计函数“FREQUENCY”来创建频数分布表和直方图,可解决这一问题。创建频数分布表的步骤是 选择与接受区域相临近的单元格区域,作为频数分布表输出的区域 选择统计函数中的“FREQUENCY”函数 在对话框Date-array后输入数据区域,在Bins-array后输入接受区域 同时按下ctrl-shift-Enter组合键,即得到频数分布 次数分配直方图 直方图(histogram) 用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布 在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图 直方图下的总面积等于1 分组数据的图示(直方图的绘制) 折线图(frequency polygon) 折线图也称频数多边形图 是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉 折线图的两个终点要与横轴相交,具体的做法是 第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴 折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的 分组数据的图示(折线图的绘制) 次数分配的类型 洛伦茨曲线 洛伦茨曲线 20世纪初美国经济学家、统计学家洛伦茨(M.E. Lorentz)根据意大利经济学家巴雷特(V. Pareto)提出的收入分配公式绘制而成描述收入和财富分配性质的曲线分析该国家或地区分配的平均程度 基尼系数 20世纪初意大利经济学家基尼(G. Gini)根据洛伦茨曲线给出了衡收入分配平均程度的指标 A表示实际收入曲线与绝对平均线之间的面积 B表示实际收入曲线与绝对不平均线之间的面积 基尼系数 是20世纪初意大利经济学家基尼根据洛伦茨曲线给出的衡量收入分配平均程度的指标。表示A与 (A+B)的比值。 联合国依据基尼系数做出规定: 低于0.2表示收入绝对平均;0.2-0.3表示比较平均;0.3-0.4表示相对合理;0.4-0.5表示收入差距较大;0.6以上表示收入差距悬殊。 我国2008年2月 0.47 本章小结 统计数据的整理 联合国依据基尼系数做出规定: 低于0.2表示收入绝对平均; 0.2-0.3表示比较平均; 0.3-0.4表示相对合理; 0.4-0.5表示收入差距较大; 0.6以上表示
文档评论(0)