- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 3 章 数据的整理与显示 第 3 章 数据的整理与显示 3.1 数据的预处理 3.2 统计分组与频数分布 3.3 统计图 3.4 统计表 学习目标 了解数据预处理的内容和目的 掌握统计分组的方法 掌握品质数据的整理与图示方法 掌握数值型数据的整理与图示方法 用Excel作频数分布表和统计图 合理使用统计表 数据的预处理 数据的审核 检查数据中的错误 数据的筛选 找出符合条件的数据 数据排序 升序和降序 寻找数据的基本特征 一、数据审核 数据审核—原始数据(raw data) ? 审核的内容 完整性审核 应调查的单位或个体是否有遗漏 调查项目或指标是否填写齐全 准确性审核 内容是否真实反映客观实际情况 是否有错误:逻辑检查、计算检查 数据的审核—二手数据(second hand data) 适用性审核 数据的来源、口径以及有关的背景材料 数据是否符合自己分析研究的需要 时效性审核 最新的数据 确认是否要做进一步的加工整理 二、数据筛选 数据筛选(data filter) 数据筛选的内容包括 将某些不符合要求的数据或有明显错误的数据予以剔除 将符合某种特定条件的数据筛选出来 数据筛选(data filter) ?用Excel进行数据筛选 三、数据排序 数据排序 (data rank) 将数据按一定顺序排列,以发现一些明显的特征或趋势。 排序有助于对数据检查纠错,以及为重新归类或分组等提供依据 在某些场合,排序本身就是分析的目的之一 数据排序 (方法) 分类数据的排序 字母型数据:升序、降序。 汉字型数据:按首位拼音字母排列,或按笔画多少排序。 数值型数据的排序 递增排序:x(1)x(2)…x(n) 递减排序:x(1)x(2)…x(n) 数据排序 (方法) ?用Excel进行数据排序 一、统计分组的概念及方法 (一)统计分组的概念 根据统计研究的目的和客观现象的内在特点,按照一定的标志把被研究总体划分为若干个性质不同但又有联系的组,称为统计分组。 (二)统计分组的方法 1、按品质标志分组 :按研究对象的某种属性特征分组 (1)简单分组:人口按性别分组,企业按行业分组,学生按专业分组等等 (二)统计分组的方法 (2)复合分组:对总体按两个或两个以上的标志进行的重叠式分组。 例如,我国把社会经济部门分为第一产业、第二产业、第三产业,第一产业又可分为农、林、牧、渔业。 复合分组表 (二)统计分组的方法 2、按数量标志分组 :按表现总体数量特征的标志进行分组 。 例如,人口按年龄分组、企业按销售额分组等 (1)单项式分组:每组变量值是一个值 (2)组距式分组:每组变量值是一个区间。 某车间工人产量分组表 某地区120家企业按利润分组表 二、频数分布 频数分布的概念 频数(frequency) :落在某一组中的数据个数 频数分布(frequency distribution) :把各个组及其相应的频数全部列出,并用表格形式表现出来,称为频数分布。 比率(ratio) :各组次数与总次数之比。 百分比(percentage) :将比率乘以100得到的值 (一)品质数据的频数分布 1、分类数据的频数分布表 (1)列出各类别 1、分类数据整理—频数分布表 (例题分析) 分类数据整理—频数分布表 2、顺序数据的整理(可计算的指标) (1)累积频数(cumulative frequencies):各类别频数的逐级累加 (2)累积频率(cumulative percentages):各类别频率(百分比)的逐级累加 向上累积:由第一项向最后一项累加(变量值由小到大累加) 向下累积:由最后一项向第一项累加(变量值由大到小累加) 顺序数据的频数分布表(例题分析) 顺序数据的频数分布表 (例题分析) 3、分类汇总 如果我们已经建立了一张某单位部分人事统计表,如下所示。试按职称进行分类汇总。 4、数据透视表(pivot table ) 可以从复杂的数据中提取有用的信息 可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图 形成一个符合需要的交叉表(列联表) 注意:数据源表中的首行必须有列标题 数据透视表(用Excel创建数据透视表) 第1步:在Excel工作表中建立数据清单 第2步:选中数据清单中的任意单元格,并选择【数据】菜单 中的【数据透视表和数据透视图】 第3步:确定数据源区域 第4步:在【向导—3步骤之3】中选择数据透视表的输出位置 。然后选择【布局】 第5步:在【向导—布局】对话框中,依次将”分类变量“拖至 左边的“行”区域,上边的“列
您可能关注的文档
最近下载
- 《年产30万吨轻油裂解气高压深冷分离制取乙烯工艺设计》-毕业设计(论文).doc VIP
- 防火墙(共57张课件).pptx VIP
- 教科版科学六年级上册第一单元《微小世界》测试卷完整版.docx VIP
- 《创新创业实用教程》课件——任务1 创业意识认知.pptx VIP
- 新教材解读及实施课件-统编版道德与法治八年级上册.pptx
- 妇科腹腔镜技术应急预案.pptx VIP
- 水利工程监理工作报告 .pdf VIP
- 工业产品生产单位落实质量安全主体责任知识分享.pptx VIP
- 课本附录单词表+Vocabulary+from+primary+school(小学单词表)2024-2025学年人教版英语七年级上册.xlsx
- 学前儿童家庭与社区教育 课程概述 第一章 家庭与学前儿童家庭教育.ppt VIP
文档评论(0)