- 1
- 0
- 约6.07千字
- 约 42页
- 2022-10-27 发布于上海
- 举报
会计学
1
多元回归分析的原理与应用
2
提 纲
多元回归分析的统计原理
多元回归分析在心理学研究中的应用
第1页/共42页
3
1 多元回归分析(regression)的统计原理
回归分析的含义
回归分析的分类
一元线性回归
多元线性回归
在SPSS中如何做多元回归分析
第2页/共42页
4
1.1 回归分析的含义
客观世界中事物之间的关系是各种各样的。从定量的角度看,主要有两种:一是确定性关系,如重力加速度,即自由落体的距离与时间:S=0.5gt2;另一类是不确定性关系,即相关关系。
由于事物的变化常常受多种因素的影响,导致了事物变化的不确定性。人们常用相关系数来描述事物之间的这种不确定性程度。
但对于如何通过一个事物的值去估计和预测另一个事物的发展变化,相关系数却无能为力。但是,通过大量的实际调查,可以总结出它们之间的关系,回归分析即是对这种关系的描述。
第3页/共42页
5
1.1 回归分析的含义
“回归”一词最早由英国统计学家高尔顿(Francis Galton)在19世纪末期研究孩子的身高和他们父母身高关系时提出。
研究发现,孩子的身高总是趋于他们父母身高的平均值。孩子的身高,比身材矮的父母要高,比身材高的父母要矮,这种趋于中间值的趋势称作“回归效应”,而他提出的这种研究两个数值变量关系的方法称作回归分析。
第4页/共42页
6
1.1 回归分析的含义
含义:是借助数学模型对客观世界所存在的事物间的不确定关系的一种数量化描写,即通过一个或几个变量的变化去解释另一变量的变化。
目的:在于对相关随机变量进行估计、预测和控制,确定变这些量之间数量关系的可能形式,并用一个数学模型来表示。
第5页/共42页
7
X
Y
•
•
•
•
•
•
•
•
自变量(independent variable):解释变量,给定的或可以控制的、用来解释、预测因变量的变量。
因变量(dependent variable):响应变量,由自变量来解释其变化的变量。
在回归分析中:
第6页/共42页
8
1.1 回归分析的含义
数学模型: y=f(x1,x2,x3,…,xi)+
模型的基本含义:
因变量y受到两部分自变量的影响,即:已知的K个自变量x1,x2,x3,…,xi的影响;一些未知因素或随机因素的影响。对于K个已知自变量的影响,设想可以通过函数f(x1,x2,x3,…,xi)来表示,而剩下的将由那些未知因素或随机因素的影响确定,将这些影响的结果记为,称为随机误差。对于每一组实际观察获得的值yi,x1,x2,x3,…,xi就可以表示成: yi= f(x1,x2,x3,…,xi)+
第7页/共42页
9
1.1 回归分析的含义
对于自变量x1,x2,x3,…,xi的每一组确定的值,f(x1,x2,x3,…,xi)的值也是确定的;但由于是不确定的,所以,y也是不确定的,但在每一组确定的自变量之下,所有的服从均数为零的正态分布,因此,对于自变量的每一组确定的值,因变量也服从正态分布,其平均数就是f(x1,x2,x3,…,xi),该公式即为回归方程,记为:
第8页/共42页
10
回归分析
按自变量个数分类
一元回归简单回归
多元回归复回归
按方程式特征分类
线性回归
非线性回归
1.2 回归分析的分类
第9页/共42页
11
1.3 一元线性回归
只有一个自变量的线性回归叫一元线性回归,也叫简单回归。
与方差分析不同,在回归分析中,“元”是指自变量,而不是指因变量。
第10页/共42页
12
总体的一元线性回归模型:
残差
假定:
E()=0
总体的一元线性回归方程:
第11页/共42页
13
一元线性回归方程的几何意义
一元线性回归线的可能形态
第12页/共42页
14
样本的一元线性回归方程:(估计的回归方程)
总体未知参数
以样本统计量估计总体参数
回归系数
第13页/共42页
15
第14页/共42页
16
最小二乘法
因为一组数据可以有多条回归直线,但是哪条最理想呢?
想得到比较精确的回归方程,必须使用最小二乘法。
最小二乘法就是使误差的平方和最小。
误差e就是残差ε, e=y-y,其平方和为:
∑(y-y)2=∑(y-a-bx)2
要使误差最小,只要分别对a、b求偏导数,使其=0即可。
第15页/共42页
17
判定系数(Coefficient of determination):估计的回归方程拟合优度的度量,表明Y 的变异性能被估计的回归方程解释的部分所占比例的大小。是判定回归方程有效性高低的指标
r2
当残差平方和为 0时,判定系数为 1 ,为完全的拟合。
当残差平方和最大时,判定系数为 0,为最差的拟合。
原创力文档

文档评论(0)