- 1、本文档共67页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
28
第4章数据的描述性整理
从统计调查中获得的原始资料是有限总体中各个个体的特征,也可能是有限总体的概率样本(见§6.1)中各个个体的特征。如对某个问题的看法、感觉,某个个体的数量水平等等。这些原始数据是杂乱无章的,要想通过他们反映总体的特征,就须对其进行整理。此外所收集的资料可能有一些虚假、差错、短缺等现象,对于这种原始资料也需要进行加工,这样,才能保证资料的真实、准确和完整。
§4.1数据的汇总
调查数据汇总,是根据预先设计的统计分组方案和统计指标体系,把调查单位归入其应属的组内,然后根据调查结果,将调查单位的有关标志值汇总,得到有关统计指标的工作过程。汇总的操作方法可分为手工汇总和电子计算机汇总。
一、手工汇总
常用的手工汇总技术有以下三种。
1.划记法。这是一种利用点、线记录各组单位数的汇总技术。它只能汇总各组频数,而不能汇总标志值;只能处理较少量的数据,而不宜于处理大量的数据。其应用有一定的局限性。
2.过录法。这种方法是根据统计分组的要求,分别将各个单位调查表中的有关资料抄录到事先准备好的分组过录表中它们应属组的项下,并计算出各组及总体的汇总结果,最后填入正式统计表。这种方法既可汇总各组频数,也可汇总标志值,而且便于核查差错。但工作量较大,在过录中容易发生错误。因此应用范围一般是需要汇总的单位不太多,分组层次也较简单的场合。
3.折叠法。这种方法是先将分在同一组内的所有调查表中需要汇总的项目折叠在表的边缘,并将它们叠放在一起,再进行汇总计算。这种方法省去了过录环节,较为经济。但一旦发生差错不易检查更正,并且调查表易损坏。
二、电子计算机汇总
利用电子计算机技术进行统计汇总的过程主要有以下五步:
(1)编程序。即根据整理方案的要求,用计算机语言,对计算机在汇总中的工作规程进行安排。对于规范化的整理方案,汇总程序可存贮起来,制成数据汇总的专用软件。
(2)编码。这是为适应计算机的工作特点把文字资料数字化的工作。为了用计算机处理分组问题,首先需要把各种品质分组标志下所拟的各组名称给以数字代号。例如“性别”这一分组标志下设“男”、“女”二组,可以分别以“1”和“2”作它们的代码。对于复杂的品质标志分组,在国家统一制订的标准化分类目录中规定了统一的标准化代码。例如,在《国民经济行业分类和代码》中,将国民经济各行业划分为门类、大类、中类、小类四级。门类用罗马数字Ⅰ、Ⅱ、Ⅲ、…表示,大、中、小类用四位阿拉伯数字代表。大类采用顺序编码法,用四位代码的第一、二位代表;中类、小类采用等级制编码法,用第三位代码代表中类,用第四位代码代表小类。表4.1是摘录《国民经济行业分类和代码》中的部分内容。其次,为了把具体的调查资料输入计算机,还应把每一张调查表中各种品质标志的具体表现依照统一的标准分类和代码分别标注相应的代码。例如对于一份农民个人经营的淡水养鱼场的调查表,对“所属国民经济部门”这一标志,应给以代码“0521”;对“经济类型”这一分组标志,应
29
将经济类型分组设计中对“个体经营”组所规定的代码给与该调查表。表4.1国民经济行业分类和代码
门类
大类
中类
小类
类别名称
Ⅰ
01
011
019
0110
0190
农、林、牧、渔、水利业
农业
种植业
其他农业
03
04
030
041
042
049
0300
0410
0420
0490
林业畜牧业
牲畜饲养放牧业家禽饲养业
其他畜牧业
05
051
0511
0512
渔业
海水渔业
海水养殖业
海水捕捞业
06
07
052
060
071
072
073
074
079
0521
0522
0600
0710
0720
0730
0740
0790
淡水渔业
淡水养殖业
淡水捕捞业
水利业
农、林、牧、渔、水利服务业
农业服务业林业服务业畜牧服务业渔业服务业
其他农、林、牧、渔、水利服务业
Ⅱ
可见,在编码这一工作环节中须解决好两个问题;一是对于国民经济和社会的各种重要的分类(分组),要实现分类标准化和编码标准化;二是调查资料的编码要严格执行国家的统一规定,并作到准确无误。
(3)数据录入。就是把实际数字和编码通过录入设备记载到存贮介质上(如磁带、磁盘等)。由计算机通过它本身的装置把这些数据转变成机器可以识别的电磁信号。
(4)逻辑检查。也称数据的编辑。即按照事先规定的一套编辑规则由计算机自动对录入的数据进行检查。对于有问题的数据,有些可由计算机按编辑规则自动更正;也有的会被计算机退回,由人工检查改正。显然,数据“编辑”的效果能否令人满意,关键在于编辑规则是否合理。
(5)制表打印。计算机按事先编制好的汇总程序会最后生成统计表,
文档评论(0)