3数据的整理
第四章 统计数据的整理 第一节 统计整理概述 一、统计整理概念 统计数据的整理(summarizing data)是指对所搜集的数据进行加工整理、使之系统化、条理化,以符合分析的需要。 包括对原始资料的整理和次级资料的整理 统计资料的整理是实现从个体单位标志值过渡到总体数量特征值的必经阶段,是统计分析的前提。 二、统计整理的程序 (一)设计统计整理方案 (二)对统计资料进行审核 (三)统计资料的分组与汇总 (四)编制统计图表 (五)统计资料的积累和保管 第二节 统计资料具体整理过程 统计数据的具体整理过程主要包括包 括数据的预处理、分类或分组、汇总等几 个方面。 一、数据的预处理 主要包括:数据的审核、筛选、排队 (一)、数据的审核与筛选 (一)、数据的审核与筛选 审核: 对第一手资料(直接调查或试验取得):审核其完整性与准确性 完整性审核:应调查的单位或个体是否有遗漏;所调查的项目是否填齐全。 准确性审核:内容是否符合实际;计算是否正确。 对第二手资料(获取他人的资料):审核其完整性、准确性、适用性、时效性 筛选: 调查结束后,当对数据中发现的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,就需要对数据进行筛选。 筛选包括:剔除不符合要求的数据或有明显错误的数据;将符合特定条件的数据筛选出来。 (二)数据的排序 数据排序是按一定顺序将数据排列。 排序目的:通过浏览数据发现一些明显的特征趋势或解决问题的线索;有助于数据的检查纠错。 排序方式:数字型数据/字母型数据 :升序或降序; 汉字型数据:多种顺序 , 比如:拼音字母顺序或笔划顺序 。 二、统计分组 (一)统计分组的概念与种类 1、统计分组的概念 统计分组是将预处理过的数据按照某 种标志(特征或标准)分成不同性质的组。 统计分组标志:分组时所依据的特征 或标准,有品质标志和数量标志。 统计分组对总体而言是分,对于单位而言是合。由此可见,选择一种分组方法,突出一种差异,显示了一种矛盾,同时必然掩盖了其他差异。不同的分组方法,可能得出不同的结论。 2、统计分组的原则 穷尽性原则 互斥性原则 3、统计分组的种类 (1)按分组标志的多少,分为简单分组和复合分组。 (2)按分组标志的性质不同,分为品质标志分组(或称属性分组)和数量标志分组(或称变量分组) (3)按分组的作用和任务的不同,分为类型分组、结构分组和分析分组。 (二)统计分组的方法 1、品质标志的分组方法 关键是确定分组标志。一般比较简单,主要采用统一的分类标准。品质标志划分各组界限一般取决于统计分析对各组粗细的要求。但也要注意变异间的过度形态,是组限不易划分。例城乡划分。 2、数量标志的分组方法 关键是确定分组标志和确定分组界限。 ★分组数列的种类: 2、数量标志的分组方法 (1)单项式分组与组距式分组 单项式分组适用于离散型变量且变量变动范围不大的场合。比如育龄妇女按其生育子女存活数分组。 组距式分组适合于连续型变量或者变动范围较大的离散型变量。 (2)间断组距式分组和连续组距式分组 如果变量值只是在整数间变动,可采用间断组距式分组,也可采用连续组距式分组。比如企业数、职工人数等。 如果变量值在一定范围内的表现既可以是整数,也可以是小数,只能采用连续组距式分组。比如产值、身高、体重。 注意:“上限不在内”原则的应用。 (3)等距分组与异距分组 等距分组适用: 标志值变动比较均匀的情况。 异距分组适用: 标志值分布很不均匀的场合; 标志值相等的量具有不同意义的场合; 标志值按一定的比例发展变化的场合。 (4)组距、组数、组限与组中值的计算 组距=上限-下限= 本组上限-前组上限 =本组下限-前组下限 组数的确定: 经验上以5~20之间为好,尤其注意不要确定太多的组数,使得每组包含的数据太少。 组数的确定: 实际分组时常按斯特格斯(Sturges) 提出的经验公式来确定组数K: 组中值计算: 组中值=(上限+下限)/2 第三节 频数分布
您可能关注的文档
- 生物统计学上机操作复习题-Data for test1.doc
- 精品高中英语必修1unit5Language points.ppt
- StatMod.doc
- 6.java.lang包.ppt
- 2014年高考人教版英语总复习课件1-5Nelson Mandela.ppt
- 清华大学化工原理第四章干燥DRY2.ppt
- 大牛简历2.doc
- 大学生惧怕否定评价与社交行为的研究..doc
- 英语必修1-5复习.ppt
- 第2章立体上点的投影.ppt
- 华福证券-消费建材-地产链下的修复良机.pdf
- 华鑫证券-牧原股份(002714)公司深度报告:以成本优势构筑护城河,驱动产能与业务双扩张.pdf
- 国盛证券-固定收益点评-2025年各地成绩单——经济、财政与债务盘点.pdf
- 东吴证券-存储行业格局落定,价值归真:从周期波动走向技术溢价.pdf
- 光大证券-房地产行业百强房企销售跟踪(2026年1月):TOP10房企开年销售表现相对较好.pdf
- 国海证券-电池行业锂电2026年度投资策略-景气向上,迈入新周期.pdf
- 华宝期货-2026年2月有色金属分析报告-金融属性放大波动,有色贵金属板块联动.pdf
- 华创证券-【资产配置快评】总量“创”辩第121期:金银巨震,大类资产风波又起.pdf
- 浙商证券-华阳股份-600348-深度报告-煤炭主业稳增长,新兴产业启新程.pdf
- 华西证券-利率月报:2月债市,关注资金与风偏.pdf
原创力文档

文档评论(0)