第3讲 统计数据的整理.ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3讲 统计数据的整理

第 3 讲 数据整理与展示 3.1 数据的录入 3.2 数据的预处理 3.3 数据分组(重点) 3.4 统计表和统计图 学习目标: 1.掌握计算机软件建立数据库 2.掌握数据预处理的内容和目的 3.掌握数据分组方法,并熟练编制统计表和统计图 3.1 数据的录入 3.1.1 纸制统计表 3.1.2 excel数据库 3.1.3 spss数据库 3.1.1 纸制统计表  在纸上手绘统计表格,横行为个体,纵行为变量,纪律原始数据 3.1.2 excel数据库 3.1.3 spss数据库  建立一个spss文件后  命令:file —— new —— data ——save 在 variable view界面设置变量 在 data view 界面输入个体数据   3.2 数据的预处理 3.2.1 数据审核 3.2.2 数据筛选 3.2.3 数据排序 数据的预处理 数据审核 检查数据中的错误 数据筛选 找出符合条件的数据 数据排序 升序和降序 寻找数据的基本特征 3.2.1 数据审核 ?原始数据(raw data) 完整性审核 检查应调查的单位或个体是否有遗漏 所有的调查项目或指标是否填写齐全 准确性审核 检查数据是否真实反映客观实际情况,内容是否符合实际 检查数据是否有错误,计算是否正确等 逻辑检查和计算检查 ?二手数据(second hand data) 适用性审核 弄清楚数据的来源、数据的口径以及有关的背景材料 确定数据是否符合自己分析研究的需要 时效性审核 尽可能使用最新的数据 确认是否有必要做进一步的加工整理 3.2.2 数据筛选 当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选 数据筛选的内容 将某些不符合要求的数据或有明显错误的数据予以剔除 将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除 3.2.3 数据排序 按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索 排序有助于对数据检查纠错,以及为重新归类或分组等提供依据 在某些场合,排序本身就是分析的目的之一 3.3 数据分组 3.3.1 统计分组 3.3.2 品质分组 3.3.3 数量分组 3.3.4 累积频数分布 3.3.1 统计分组 统计分组:根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,了解数据分布的规律和特征 标志:总体各单位普遍具有的属性或特征 统计分组的原则: 穷尽原则:分组对象的每个单位都应该有组可归。 互斥原则:任何一个单位只能属于某一组,而不能同时或可能归属于几个组 分组的方法:品质分组和数量分组 3.3.2 品质分组 1. 列出各品质 频数(frequency) :落在各品质中的数据个数 比例(proportion) :某一品质数据占全部数据的比值,一般用百分比来表示%. (例题分析) 3.3.3 数量分组 单变量值分组 1. 将一个变量值作为一组 2. 适合于离散变量 3. 适合于变量值较少的情况 组数太多不便于观察数据 分布的特征和规律 例: 教科书p22页表2-2 某社区家庭户拥有孩子数情况表 组距分组 将变量值的一个区间作为一组 适合于数据较多的离散型变量和连续变量 上限不在内原则 可采用等距分组,也可采用不等距分组 离散型数据 某村庄家庭户拥有孩子数情况表 连续型数据(等距分组) 某工厂工人完成生产定额情况表 不等距分组 某地区人口分布情况 组距分组(步骤) 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按 Sturges 提出的经验公式来确定组数K 组距分组几个概念 1. 下限:一个组的最小值 2. 上限:一个组的最大值 组距 :上限与下限之差 连续型:组距=本组上限 – 本组下限 离散型:组距=本组上限 – 前组上限 4. 组中值 :下限与上限之间的中点值 3.3.4 累积频数分布 累积频数(cumulative frequencies):各分组频数的逐级累加 累积频率(cumulative percentages):各分组频率(百分比)的逐级累加 只适合于定序尺度以上的数据 (例题分析) 3.4 统计表和统计图 3.4.1 统计表 3.4.2 统计图 3.4.1 统计表 统计表的设计 合理安排统计表的结构 总标题内容应满足3W (时间、地点、何种数据)要求 数据计量单位相同时,

文档评论(0)

3471161553 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档