- 3
- 0
- 约8.22万字
- 约 42页
- 2025-10-22 发布于河北
- 举报
第一章数据分析的基础
第一节数据分组与变量数列【★★★单选、简答】
一、*数据分组
1.数据分组:就是对某一变量的不取值,按照其自身变动特点和研究需要划分成不的
组别,以便更好地研究该变量分布特征及变动规律.由于变量有离散变量与连续变量的
区别,因而对其进行分组可分为单项分组与组距分组两种不的分组方法。
2.若变量是离散型变量,且取值只有不多的几个时,则采用单项分组,单项分组的做法是:
将变量的不取值作为一组的组别,变量有多少个不取值就划分成多少组。
3.若变量是连续型变量,或者是取值较多的离散型变量,则需采用组距分组.组距分组的
做法是:将变量的全部取值按照其大小顺序划分成若干个不数值的区间。
二、里变量数列
1.▲变量数列的概念:在对变量取值进行分组的基础上,将各组不的变量值与其变量值
出现的次数排列成的数列,称为变量数列,由于对变量分组有单项分组和组距分组两种
不的方法,因而分组后所形成的变量数列也有单项数列和组距数列两种。
2.▲变量数列组成要素:组别:由不变量值所划分的组;频壑:各组变量值出现的次数;
频率:各组次数与总次数之比。
3.编制组距数列的步骤:
1)确定组数:组距大、组数就少;组距小、组数就多。
2)确定组距:上下限之间的距离,开口组参照相邻组;开口组组中值参照相邻组
3)确定组限:每组的最大值称为该组的上限,最小值是下限;组中值=(上限+下限)/2
上限不在内,下限一定在内。【2013.11案例分析一小题】
4)计算各组的次数(频数):
5)编制变量数列:
4.向上累计频数(或频率)的具体做法是:由变量值低的组向变量值高的组依次累计频数
(或频率),向上累计频数的结果表明某组上限以下的各组次数(或频数)之和是多少;
向上累计频率的结果表明某组上限以下的各组次数(或频数)之和占总次数(或总频数)
的比重是多少。【例题:P7]
5.向下累计频数(或频率)的具体做法是:由变量值高的组向变量值低的组依次累计频数
(或频率),向下累计频数的结果表明某组下限及以上各组次数(或频数)之和是多少;
向下累计频率的结果表明某组下限及以上各组次数(或频数)之和占总次数(或总频数)
的比重。
6.变量数列分布图:常用的次数分布图主要有柱状图、直方图和折线图等几种。[2013.11
案例分析要求画直方图、折线图】
7.▲什么是洛伦茨曲线?它的主要用途是?
洛伦茨曲线就是累计频数(或频率)分布曲线,主要用途是研究社会财富、土地和
工资收入的分配是否公平。
第二节分布中心的测度
一、・▲分布中心的概念及意义【★★单选、简答】
1.分布中心:是指距离一个变量的所有取值最近的位置。
2.分布中心的意义:
a)变量的分布中心是变量取值的一个代表,可以用来反映其取值的一般水平。
b)变量的分布中心可以揭示其取值的次数分布在直角坐标系上的集中位置,可以用来
反映变量分布密度曲线的中心位置,即对称中心或尖峰位置。
二、・分布中心的测度指标及其计算方法★★单选、案例】P14
1>算术平均数
・上运用算术平均数应注意什么问题,在实际应用中如何有效避免这些问题?
算术平均数容易受到极端变量值的影响。当一个变量的取值出现极小或极大,都将影响其计
算结果的代表性。为了提
您可能关注的文档
最近下载
- 核反应堆设计软件:FLUKA二次开发_(1).FLUKA软件基础与应用.docx VIP
- 【初中体育】说课稿万能模板.docx VIP
- 核辐射防护软件:FLUKA二次开发_(10).用户自定义功能开发.docx VIP
- NB_T 47016-2023 承压设备产品焊接试件的力学性能.pdf VIP
- 机电设备安装-工程施工方案.docx VIP
- 核辐射防护软件:FLUKA二次开发_(7).物理模型与核反应.docx VIP
- 核辐射防护软件:FLUKA二次开发_(8).数据输出与后处理.docx VIP
- 核辐射防护软件:FLUKA二次开发_(9).并行计算与优化.docx VIP
- 核辐射防护软件:FLUKA二次开发all.docx VIP
- 一种复合增韧剂、制备方法、应用和高抗冲聚苯乙烯树脂组合物及其制备方法.pdf VIP
原创力文档

文档评论(0)