- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 数据整理和频数分布
3.1 数据的审核和筛选
3.2 数据的分组
3.3 数据的频数分布
3.4 绝对数
3.5 数据的展示
3.1 数据的审核和筛选
3.1.1 数据的审核
3.1.2 数据的筛选
3.1.3 数据的排序
3.1.1 数据的审核
1.原始数据
原始数据(Raw Data)是指数据搜集所取得到的,未
经过数据分组和汇总的,反映个体特征的零散数据。
数据审核(Data Auditing)是指在进行数据整理之前
对原始数据的审查和核对。
原始数据包含了所有由调查登记获取的个体信息的初
级数据,经过数据整理的数据反映的是总体的综合数
量特征和分布状态,原始数据所反映的个体数值特征
消失或湮没在总体的综合数量特征和分布状态数值之
中了。
数据整理是按照数据分析的要求进行的,数据
分析思路和目的决定着数据整理分类或分组。
2 .数据审核的内容
统计数据的时效性,准确性、一致性三个方面
的标准就是数据审核的基本内容。
(1)统计数据的时效性审核。检查是否在规
定的统计调查时间内完成数据搜集,采集的数
据是否为规定的调查时点上,或规定的调查时
段内的数量特征。
(2 )统计数据的准确性审核。从数据的完整
性、真实性和精确性角度进行审核。
检查调查对象中每一个单位是否不重复、不遗
漏地包含在统计调查的实际登记资料之中,或
抽样调查的抽样框不重复、不遗漏地包含统计
调查对象所有调查单位。检查是否每一个调查
单位的特征都无偏差、无失真、准确无误地反
映在登记资料中,以及抽样调查的抽样误差是
否有效控制在规定的许可范围内。
(3 )统计数据的一致性审核。检查统计数据
在时间和空间上的连续性和可比性。
3.数据审核的方式
数据审核一般有逻辑检查和技术检查两种方
式。
(1)逻辑审核(Logistic Auditing)是按照数据
审核的内容,采用逻辑分析的方法,检查原始
数据中各项数据是否合理的数据审核方式。逻
辑检查要求检查人员具备较强逻辑推理能力,
以及丰富的专业知识和数据审核经验。
(2 )技术审核(Technical Auditing)是按照数
据审核的内容,通过对调查数据原始登记表,
和其它原始登记材料进行机械性核对,来实施
的数据审核方式。
填报单位是否存在漏报和重报,调查项目是否
填齐,所填内容是否符合填报要求,填报数据
有无错行、错栏问题,计量单位是否正确,各
栏之间的合计数、乘积数与相关分项数据是否
相符等。
人口调查表逻辑审核要点
一、基本要点
姓名:未起名的新生婴幼儿应填写“C”+母亲姓
名
与户主关系:同一户调查表中,不应无户主,
也不应多于一个户主。多于一个成员的家庭
户,除户主外的其他成员最少应有一位为亲
属;集体户,除户主外的其他成员通常应为非
亲属。
性别:只能填“1”或“2”码。
出生日期:应填满填8位数字码;前4位年份码
应不大于2010,不小于1879;第5、6位月份
码为01~12的数字;第7、8位日期码为01~
31的数字;月份码为02时,日期码应为不大于
29 的数字。
公民身份证号码:应填18位数字码(个别情况
最后一位空填)。第7至14位码应与“出生日期”
项相同;“性别”项为男性时,第17位码应为奇
数,否则为偶数。
户口性质:只能填“1”、“2”或“9”码。
文化程度:注意年龄与文化程度的关系,一般
是小年龄不应有高学历。
婚姻状况:属已婚、丧偶、离婚的,出生不应
晚于1989年6月。
流动原因:只能填“1”、“2”或“9”码。
二、流出人口信息调查表
户籍地(A0):只能填写本村(居)委名称。
流出日期(A8):不得早于出生日期。
三、流入人口信息调查表
现居住地(B0):只能填写本村(居)委名称。
流入日期(B9):不得早于出生日期。
3.1.2 数据的筛选
数据筛选(Data Filter )是指对已有数据的有
意识的过滤和挑选,滤去不需要的数据,选出
所需要的数据。
从广义上讲,数据审核也是一种数据筛选。这
文档评论(0)