- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 统计整理 【内容提要】 本章结合EXCEL的操作介绍了统计数据的整理过程。第一节介绍数据的预处理:审核、排序、筛选、分类汇总、数据透视表。第二节分别介绍分类数据、顺序数据、数值型数据的整理与图示方法。第三节介绍统计表的设计。 第一节 数据预处理 在对数据用图表展示之前,需要对数据进行初步的整理,即为数据预处理。数据预处理的内容包括审核、排序、筛选、分类汇总、数据透视表等。 一、数据审核 数据审核是指检查数据是否满足统计分析的要求。对于通过其他渠道收集的二手数据,主要是审核数据的适用性和时效性。 对于通过调查取得的原始数据主要是判断数据是否有错、是否完整,主要从完整性和准确性两个方面去审核。 (一)完整性审核 完整性审核检查应调查的单位或个体是否有遗漏,所有的调查项目或指标是否填写齐全等。在调查中由于受访者未回答或是访问员疏忽漏登调查项目造成数据不完整。如果在表格中,某一个数据采集时无法获得,就会出现缺失值。缺失值是指在数据采集与整理过程中丢失的内容。 根据插值的不同,有如下一些方法: 1、随机插值 2、依概率插值 3、就近插值 4、分类插值 (二)准确性审核 准确性审核是检查数据是否有错误,是否存在异常值(超过正常范围的取值)。若发现存在异常值要进行认真鉴别,判断异常数据的真假。通常从数据结构是否符合常规逻辑判断异常数据的存在,称为逻辑校正。 二、排序 按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索。排序有助于对数据检查纠错,以及为重新归类或分组等提供依据。 三、筛选 数据筛选是根据需要将符合某种特定条件的数据筛选出来。在EXCEL中筛选分自动筛选和高级筛选。 四、分类汇总 分类汇总是按照要求分成不同的类别进行统计,可以按照一个分类变量分类统计,也可以按两个或多个变量分类统计。相应的有一级分类汇总和二级分类汇总。 五、数据透视表 数据透视表可以根据使用者的需要,方便地对数据进行汇总和作图,形成一张交叉表,并可实现查询功能。 第二节 数据的整理与展示 数据经过预处理之后,要经过整理与展示。对于不同类型的数据,所采取的处理方式和方法是不同的。从品质数据(包括分类数据和顺序数据)到数值型数据,数据由低级往高级方向发展。数据越高级,适用的统计方法就越多。适用于低级数据的统计方法必然也适用与高级数据,反之不成立。对品质数据主要是做分类整理,对数值型数据主要是做分组整理。 一、数据的整理与展示 在整理时除了要列出所分的类别外,还要计算出每一类别的频数、频率或比例、比率,同时选择适当的图形进行显示,以便对数据及其特征有一个初步的了解。 (一)频数与频数分布 1、频数是指落在各类别中的数据个数。我们把各个类别及其相应的频数全部列出来就是频数分布或称次数分布。将频数分布用表格的形式表现出来就是频数分布表。 (二)频数分布表的制作 在对分类数据整理时,其中最要的一个环节是制作频数分布表,把各个类别出现的频数用表格形式表现出来。 (三)分类数据的图示 统计图的类型有很多,多数统计图除了可以绘制二维平面图外,还可以绘制三维立体图。图形的制作均可由计算机来完成。这里首先介绍反映分类数据的图示方法,其中包括条形图(EXCEL中称柱形图)和饼图。如果两个总体或两个样本的分类相同且问题可比时,还可以绘制圆环图。 1、条形图 条形图是用宽度相同的条形的高度或长短来表示数据变动的图形。条形图可以横置或纵置,纵置时也称为柱形图。条形图有单式、复式等形式。 2、饼图 饼图是用圆形及圆内扇形的面积来表示数值大小的图形,主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用。在绘制饼图时,总体中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心角度是按各部分百分比占360°的相应比例确定的。例如评价等级为A占百分比为14%,那么其对应的扇形的中心角度就应为360°×14%=50.4°,其余类推。 二、顺序数据的数理与显示 前面介绍的分类数据的整理与显示方法,如频数、比例、百分比、比率、条形图和圆形图等,也都适用于对顺序数据的整理与显示。但有些方法适用于对顺序数据的整理与显示,却不适用于分类数据。对于顺序数据,除了可使用上面的整理与显示技术外,还可以计算累积频数和累积频率(百分比)。 (一)累积频数和累积频率 1、累积频数就是将各类别的频数逐级累加起来。其方法有两种:一是从类别顺序的开始一方到类别顺序的最后一方累加频数,称为向上累积;二是从类别顺序的最后一方到类别顺序的开始一方累加频数,称为向下累积。 2、累积频率或百分比是将各类别的百分比逐级累加起来,也有向上累积和向下累积两种方法。 1、累积频数分布图 根据累积频数或累积频率,可以绘制累积频数或频率分布图。 2、环形图 环形图与圆形图类似,但又有区别。环形图中间
文档评论(0)