数据整理.ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据整理.ppt

第三章 数据整理 3.1 数据分组 3.2 次数分配 3.3 统计指标 3.4 统计表和统计图 3.1 数据分组 一、统计数据分组的目的及原则 二、统计分组的种类 1、按分组标志的多少不同分: 简单分组:分组仅按一个标志来进行 复合分组:分组按两个或两个以上的标志进行,并且层叠在一起。 例如:对全国的工业企业进行 简单分组: 按经济类型分:全民所有制企业、集体所有制企业、城乡个体企业 按轻重工业分:重工业、轻工业 按企业规模大小分:大型企业、中型企业、小型企业 复合分组: 2、按分组标志的性质不同分: 品质分组:按品质标志进行的分组 如人口总体按性别分组、高校教师按职称分组。 变量分组:按数量标志进行的分组 如企业按职工人数分------1000人以下、1000-5000人、5000人以上 三、分组标志与分组体系的选择 1、根据统计研究的目的,在对现象进行分析的基础上,抓住具有本质性的区别及反映现象内在联系的标志来作为分组标志。 2、在统计整理中,为了全面认识被研究现象总体,常常需要运用多个分组标志对总体进行分组,形成一系列相互联系、相互补充的分组体系。 四、统计分组方法 1、品质分组的方法 分组标志一经确定,组名称和组数也就确定,不存在组与组之间界限区分的困难。 复杂的情况下,各组界限不易划分,从这一组到另一组存在各种过度状态,边缘不清。 2、变量分组的方法: 变量分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上变化来区分各组的不同类型和性质。 单项式分组:是依次将每一个变量值作为一组。 (适用于离散型变量且变量取值不多的情况) 例如,居民家庭人口数,其取值不可能很多,且每一个取值都可视为一种类型。 组距式分组:把整个变量值依次划分为几个区间,各个变量值按其大小确定所归并的区间,区间的距离称组距。 包括等距分组和不等距分组 适用于连续型变量或虽为离散型变量但取值很多,不便一一列举的情况。 1)连续型变量的组距式分组 如对商店按销售额进行分组 : 2)离散型变量的组距式分组 如对某企业的生产小组按人数分组: 组距式分组中的有关问题: (1)组距和组中值 组距两端的数值称为组限,其中:每组的起点数值称下限、每组的终点数值称上限。 离散型变量分组:各组的上下限都可以用确定的数值(整数)表示。 连续型变量分组:相邻组的上限和下限无法用两个确定的数值分别表示,因此上一组的上限同时也是下一组的下限。 例如:企业按工人工资对工人进行分组如下: 500—600元 600---700元 700---800元 如果某工人工资为700元,应将他归并到哪一组? “上组限不计入”原则:遇到某单位的标志值刚好等于相邻两组上下限时,一般把此值归并到作为下限的那一组。 (2)全距:变量值中最大值与最小值的差数 组数=全距/组距 组距=上限—下限 (3)组中值=(上限+下限)/2 合理确定组中值 3.2 次数分配 二、变量次数分配的编制 1、将原始资料按顺序排序 2、确定组数与组距 (1)当n较大时,k取10~20;当n50时, k取5~6 ; 3、确定组限 每组区间的界限称为组限。 离散型变量,分组时相邻组的组限必须间断。 如某省企业按职工人数分组,可分为:0-99,100-199,200-299,300-399,…,900-1000等; 连续型变量,相邻组的上、下限采用重叠的方法分组界定。 如按职工工资分组,0-500,500-1000,1000-1500,1500-2000,…,等; 4、将各个数据按其数值大小归入相应的组内。 分组计算 组数=1+3.322 log n (n=30) =5.9 分6组 组距:每组区间的宽度 =(观察值中的最大数值- 观察值中的最小数值)/组数 =(128-84)/6=7.3 84-91,91-98,98-105,105-112,112-119,119-126;未包含最大值 83-91,91-99,99-107,107-115,115-123,123-131; 按5组,10元作为组距,计算次数。 求次数分配表和直方图 次数分配表 累计次数分布 作图 如果分两组 分组太细会出现什么问题? 前面分组都是等距分组 也有不等距分组 在不等距分组情况下,要比较各组次数或分析总体结构,要消除由组距不等造成的影响。为此需计算单位组距的次

您可能关注的文档

文档评论(0)

kaku + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8124126005000000

1亿VIP精品文档

相关文档