- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 统计整理
第一节 统计整理的意义
统计整理是根据研究的任务,对大量原始资料进行加工汇总,使其系统化、条理化、科学化的过程。统计整理是统计工作的中间环节,是人们从对个体的认识过渡到对现象总体的认识,从感性认识上升到理性认识的过渡阶段。
统计整理的内容:1、审核;2、分组;3、汇总;4、编制统计表;5、资料的系统积累。
第二节 统计分组
一、统计分组
统计分组,是根据统计研究的需要,将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。
二、统计分组的原则
某校学生身高统计表
身高 学生人数 1.4~1.5
1.6~1.7
1.7~1.9
2.0以上 13
158
127
2 合计 300 三、统计分组的关键
如:某市居民家庭人均收入分组资料如下:
家庭人均收入 人数 900以下
900~4500
4500以上 60
420
20 合计 500 家庭人均收入 人数 600以下
600~2500
2500以上 30
350
120 合计 500
分组
平行分组体系如:
复合分组体系如:
高校学生总体
第三节 分配数列
一、概念和种类
在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,称为次数分配。分布在各组的单位数叫次数(频数),各组次数与总次数之比叫频率。
分布数列可分为
1、单项式变量数列
——适用于变量值变动范围不大的离散型变量
表3-3-1 某班学生年龄统计表
年龄 学生人数(次数) 比重(频率、比率) 18
19
20
21
22 2
5
20
18
5 2/50
5/50
20/50
18/50
5/50 合计 50 1
2、组距式变量数列
——适用于变量值变动范围较大的离散型变量和连续型变量
表3-3-2 某班《定量分析方法》成绩统计表
《定量分析方法》成绩 学生人数 比重 90—100
80—90
70—80
60—70
60以下 3
15
19
11
2 3/50
15/50
19/50
11/50
2/50 合计 50 1
二、变量数列的编制
1、整理原始资料(将数据按大小顺序排列)。
全距=最大变量值-最小变量值
2、确定变量数列的形式(确定编制单项数列还是组距数列)
3、组距式变量数列的编制
(1)确定组距和组数
组距=本组上限-本组下限
(2)等距分组和异距分组
某地区初婚年龄统计表
年龄 人数(次数) 次数密度 18以下 10 5 18~20 20 10 20~22 28 14 22~24 44 22 25 25 25 26 28 28 27 27 27 … … 30~32 30 15 32~35 27 9 35~40 36 6 40~50 35 3.5 50以上 15 1.5
(3)确定组限与组中值
组限 组
对连续型变量分组,前一组的上限与后一组的下限必须重叠。对离散型变量分组,组限最好不要重叠,当然也可以重叠。在组限重叠的情况下,确定组限所在组的原则为“上限不在组内”。
如对企业按职工人数分组,可分为:
99人以下
100—299人
300—599人
600人以上
组中值是各组上限与下限之间的中点数值,它代表各组数值的平均水平或一般水平。当然,前提是各组的数值在本组范围内呈均匀分布或在组中值两侧呈对称分布。
组中值=
对于开口组,在计算组中值时,假定它的组距与邻组的组距相等,首先按邻组的组距确定假定的上限或下限,然后再计算它的组中值。
4、次数分布的表示法
(1)条形图
条形图是用长条的高度来表示各组的次数或百分比,而长条的宽度没有意义。长条既可平行于横轴,又可平行于纵轴。如果变量的取值只有类别之分,而无顺序可言,则长条可按任意次序排列,且长条一般是离散的。如下图所示:
如果变量的取值既有类别之分,又要考虑顺序,则长条可以是紧挨着的,也可以是离散的,但长条必须按顺序排列。如下图所示:
老 中 青 不及格 及格 中 良 优
(2)直方图
成绩(分)
50 60 70 80 90 100
直方图以长条的面积来表示次数或频率,以长条的宽度表示变量的取值范围(各组组距),以长条的高度表示次数密度或频率密度。
次数密度=, 频率密度=
直方图一般用于组距数列资料的表示。
(3)折线图
成绩(分)
50 60 70 80 90 100
(4)曲线图
(5)饼图
只要将各组成
文档评论(0)