统计资料的整理.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

经济统计学

统计资料的整理;第一节资料整理的意义与内容

第二节统计分组

第三节分配数列

第四节统计表和统计图;第一节资料整理的意义与内容

一、资料整理的意义

即将大量个体单位的原始资料,进行科学的分类、汇总,使之系统化、条理化,可以有效地展示,为下一阶段的统计分析作准备。

资料整理是一个从个体到总体的过渡,也是对现象的认识从感性上升到理性的过程。

;二、资料整理的内容

(一)对原始资料进行审核

1.完整性审核

应调查的总体单位是否齐全

调查项目(标志)的回答是否完整

答案缺失的三种表现:

A.全部不回答

B.部分不回答

C.隐含不回答;2.准确性审核

逻辑检查:分析标志、数据之间是否符合逻辑,有无矛盾及违背常理的地方。

比较审查法:利用指标数据之间的关系及规律进行审查。

设置疑问框审查:利用指标之间存在一定的量值与比例关系,规定疑问框,审查数据。

通过审核发现数据差错,应根据情况及时纠正或处理:

属于填报错误,可通知填报者重新填报;

属汇总过程错误应根据情况予以修正。

;(二)检查分类方法:

是否合理、周到、可行,如有需要,进行修改。

(三)归纳与汇总:

按最后确定的分类方法,将各总体单位归入相应的组,并汇总各组和总体数据。

(四)制表、制图:

将汇总结果,编制成统计表、统计图,以备分析之用。

(五)资料积累:

将汇总资料存入数据库。如有条件可把原始资料一并存入,以便进一步加工,用于特定课题研究。;四、简单分组与复合分组

根据分组时采用标志的多少,分为:

(一)简单分组:只按一个标志对总体进行分组。

(二)复合分组:按两个以上的标志连续进行分组。;简单分组和复合分组的选择:

要根据分组目的和资料特点选择采用简单分组或复合分组。

如总体单位数众多,情况复杂,可采用复合分组。

复合分组采用标志不宜过多。

;第三节分配数列

一、分配数列的意义

根据一定标志(品质标志或数量标志)对总体进行分组,并按一定顺序排列,即形成分配数列。

分配数列的构成或要素:

1.总体分组或分组

2.总体单位在各组的分配次数(或出现次数),可用绝对数表示(频数frequency),也可用相对数(%,频率lativefrequency,或比重)来表示。

;二、分配数列的分类

根据分组标志不同,可分为:

(一)品质数列。按品质标志分组的数列

(二)变量数列。按数量标志分组的数列

变量数列分为:

1.单项数列。每个组的组值只用一个变量值来表示。适用于离散变量,且组数不多、组值变动幅度不大的情况。

2.组距数列。每个组的组值是由一对表示一定范围或距离的两个变量值形成的组。适用于连续变量,或离散变量,其变量值很多、变量波动的范围很大的情况。

;下限;在组距数列中的几个基本概念:

上限(upperlimit):组的最大值

下限(lowlimit):组的最小值

上限-下限=组距

最大组的上限-最小组的下限=全距

组中值=(上限值+下限值)/2

组中值(classmidpoint)即各组上、下限的中点

如变量值分布均匀,组中值便与组平均数一致

组中值常用来代表各组的平均水平,在统计分析中被广泛采用。;在组距数列中:

各组组距相等的,称等距数列

组距不相等的,称不等距数列或异距数列

采用等距还是不等距数列,要根据资料的特点和研究需要而定,要能反映分布的规律。

组距数列还分为:

闭口组:上、下组限齐全

开口组:缺上组限或下组限

缺下限的开口组组中值=上限-邻组组距/2

缺上限的开口组组中值=下限+邻组组距/2;三、变量数列的编制方法

(一)确定组距和组数

1.将原始资料排序,找出最大值、最小值

2.确定全距

3.确定组距和组数

组距和组数互为制约

一般可先确定组距,再根据组距确定组数。

在经济统计中,一般5-15组较合适。

应将总体单位的性质区别及其分布特征、集中趋势显示出来。

;(二)组限的确定

原则:

最小组的下限应低于或等于最小变量值

最大组的上限应高于或等于最大变量值

必要时,可采用开口组

;组限表示方法;四、累计次数表

累计次数(cumulativefrequencies)即从数列的头或尾开始,截止到某一组的上限或下限止,累计出现的次数。

分为:

1.较小制累计次数。从最小一组算起,小于该组上限的累计次数

2.较大制累计次数。从最大一组算起,大于该组下限的累计次数

;根据累计次数表可以绘制累计次数图。

以累计次数为纵坐标,分组为横坐标,较小制累计次数曲线以各组上限为横轴,较大制以各组下限为横轴。

如P43

表3-8南海公司员工工资累计次数表

图3-2南海公司员工工资

文档评论(0)

178****2493 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档