统计学相关概念概要
第1章 绪论
1、统计学是以现象的数量特征为研究对象,利用自身特有方法,发现现象应有规律的一门方法论科学。
2、总体和总体单位
(1)总体:指具有相同性质的一组个体组成的集合。即根据一定目的确定的所要研究事物的全体。
(2)总体单位:简称单位,是组成总体的各个个体。它是构成总体的基础。
3、样本和样本单位
样本:从总体中获得的一个群或组。从总体中抽取出来,作为代表这一总体的部分单位组成的集合体。
4、标志和标志表现
(1)标志:用来描述总体单位的属性、特征的概念和数值。
(2)标志表现:各单位的属性或特征的具体表现
(3)标志的分类:
按表现形式分:①品质标志
②数量标志
按有无差异分:①不变标志
②可变标志
(可变的数量标志称为变量)
5、指标:是用于说明统计总体或样本数量特征的名称和数值的总和。
6、统计调查方法
(1)普查
(2)重点调查
(3)典型调查
(4)抽样调查
7、统计分组
(1)统计分组的原则:①穷尽原则②互斥原则
(2)统计分组分类
品质标志分组:属性分布数列
统计分组 单项数列
数量标志分组:变量分布数列 等距数列
组距数列
异距数列
(3)统计分组形成次数分布数列,次数分布数列有两个组成要素:①组别②频数(③频率④累计频数(向上累计、向下累计))
(4)几个基本概念
①组距②上限③下限④组中值⑤次数密度(指本组的次数与本组组距之比,异距数列中用到)
第2章 描述统计
1、集中趋势
(1)集中趋势是指一组数据向分布的中心集中的现象。描述集中趋势的实质是找出数据的集中点或中心值。
(2)数据分布集中趋势的测度指标称为平均指标。
算术平均数
调和平均数 数值平均数(特点:受极端值影响)
常见的平均指标 几何平均数
中位数 位置平均数(特点:不受极端值影响)
众数
(3)计算公式
(、、都有简单和加权两种算法,分别适用于未分组和已分组的数据)
①算术平均数:、 二者的实质一样的,已知条件不同,
导致的算法不同而已
其中二者的关系:
②调和平均数:、
(调和平均数因变量值在分母上,因此又称倒数平均数,要求变量值不能为0)
③几何平均数:、
(几何平均数因算法为变量值的连乘积,故如果有一变量值为0,则计算结果为0)
(常见的应用几何平均数的例子:连续作业的流水线、存贷款的复利算法、产值等的连续增长)
④中位数:总体各变量值按大小顺序排列,处于中点位置的变量值就是中位数。
单项式数列:中位数位置
组距数列:中位数位置
中位数计算公式(下限公式)
⑤众数:总体中出现次数最多的数。
单项式数列:直接确定众数
组距数列:先确定众数位置,然后计算众数(下限公式)
(4)中位数、众数和算术平均数的关系:
2、离散程度
(1)除数据的集中趋势之外,数据的离散趋势 是数据分布的一个重要特征,它所反映的是各个变量值远离中心的程度,也称为离中趋势。
(2)描述数据离散程度的指标主要有:
全距
平均差 二者的基本思想一致,只是计算时对负号的数学处理方法有异,应用更广泛
标准差
方差
变异系数
(3)计算公式
①全距=最大值-最小值
②平均差:、
③标准差:、、、(是非标志的标准差)
④方差:、、
⑤方差的加法定理:总方差、组间方差、平均组内方差。三者关系
⑥变异系数:
(反应平均值代表性大小用变异系数;变异系数消除了原单位的影响。)
3、相对位置测度及异常值检测
(1)z分数:通常被称为标准化值,表示观察值偏离平均数的标准差个数。
(2)切贝谢夫定理:在任意一组数据中,至少有个数据落在与平均数倍标准差范围内,是大于1的任意数。
第3章 时间序列分析
1、时间序列是社会经济指标的数值按时间顺序排列而形成的一种数列。
2、时间序列的种类
时期序列
绝对数时间序列
时点序列
时间序列 相对数时间序列
平均数时间序列
3、时间序列的指标分析法
环比发展速度
发展速度
定基发展速度
环比增长速度
(2)速度指标 增长速度
定基增长速度
增长1%的绝对值
几何平均法:参考
原创力文档

文档评论(0)