相关分析
1. 变量间的关系
2. 相关关系描述
3. 相关关系测度
函数关系
1. 是一一对应的确定关系
2. 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量。
相关关系(correlation)
1.变量间关系不能用函数关系精确表达
2.一个变量的取值不能由另一个变量唯一确定
3.当变量 x 取某个值时,变量 y 的取值可能有几个
相关分析(correlation analysis)
相关分析是用来度量变量之间关系的技术,通常借助的工具有散点图和相关系数等。
相关关系描述
(a)不完全正线性相关
(b)不完全负线性相关
(c)完全正线性相关
(e)曲线相关
(d)完全负线性相关
(f)不相关
相关系数(correlation analysis)
相关系数是度量两个数值型变量之间线性相关程度的统计量。
总体相关系数:
样本相关系数:
相关系数(correlation analysis)
相关系数(correlation analysis)
(1)相关系数 在[-1,1]之间取值。
:两个变量呈完全线性相关,即线性函数关系。
越接近1,表明线性关系程度越强; 越接近于0,表明线性关系越弱。
(4)相关系数 具有对称性。
(3)相关系数 是一个无量纲的数值,不受变量计量单位的影响。
(2) :两个变量呈正线性相关;
:两个变量呈负线性相关;
:两个变量之间不存在线性关系,但有可能存在非线性关系。
本质上,这里的相关系数是用来测度变量间线性关系的,因此,通常又称线性相关系数。
相关分析
【例】一大型牙膏制造公司为了更好地拓展产品市场,有效地管理库存,公司董事会要求销售部门根据市场调查,找出公司生产的牙膏销售量与广告费用、销售价格、其它公司平均销售价格等之间的关系。为此,销售部门人员收集了过去30个销售周期(每个销售周期为4个星期)公司生产的牙膏销售量的相关数据。
依据这些数据分析牙膏销售量与其它变量的相关关系。
相关分析
表 牙膏销售量的相关数据
销售周期
销售量/百万支
广告费用/百万元
销售价格/元
其他公司平均销售价格/元
1
7.38
5.50
13.85
13.80
2
8.51
6.75
13.75
14.00
3
9.52
7.25
13.70
14.30
4
7.50
5.50
13.70
13.70
5
9.33
7.00
13.60
13.85
…
…
…
….
…
26
9.21
6.80
13.65
14.25
27
8.27
6.50
13.70
13.65
28
7.67
5.75
13.75
13.75
29
7.93
5.80
13.80
13.85
30
9.26
6.80
13.70
14.25
相关分析
解 绘制散点图如下:
(a)销售量与广告费用
(b)销售量与销售价格
(c)销售量与其他公司平均销售价格
正相关
负相关
正相关
密切关系程度:(a)>(c)>(b)
相关分析
解 利用收集到的牙膏销售量与广告费用数据,计算:
即牙膏销售量与广告费用之间的相关系数为0.8760。
同样方法,可计算得到:
牙膏销售量与销售价格之间的相关系数为-0.4692,
牙膏销售量与其他公司平均销售价格之间的相关系数为0.7409。
相关分析
解
CORREL函数、PEARSON函数都能实现返回两个变量间相关系数的功能。语法结构相同,为
CORREL(array1,array2)
PEARSON(array1,array2)
其中,array1、array2为两变量观察数据所在区域。
相关分析
图 Excel相关系数的运算结果
小结
1. 变量间的关系
相关关系描述
散点图
相关关系测度
相关系数
思考练习
有人曾测算得到:义务教育阶段学生的阅读能力与其脚尺寸之间的相关系数为0.91,二者的相关关系是怎样的?是否可据此推导出如下结论:脚尺寸越大的人阅读能力越好?为什么?
原创力文档

文档评论(0)