线性回归分析.pptVIP

  • 3
  • 0
  • 约2.5万字
  • 约 210页
  • 2023-07-11 发布于北京
  • 举报
回归分析 (Correlation regression);线性回归; ;回归分析一般步骤: 确定回归方程中的解释变量(自变量)和被解释变量(因变量) 确定回归模型 建立回归方程 对回归方程进行各种检验 利用回归方程进行预测 ;线性回归模型 一元线性回归模型是指只有一个解释变量的线性回归模型,用于揭示被解释变量与另一个解释变量之间的线性关系。 一元线性回归数学模型: 其中β0和β1是未知参数,分别称为回归常数和回归系数,ε称为随机误差,是一个随机变量,且应该满足两个前提条件: E(ε)=0 var(ε)=σ2;多元线性回归模型是指有多个解释变量的线性回归模型,用于揭示被解释变量与其他多个解释变量之间的线性关系。 多元线性回归数学模型: 其中β0、β1、… βp都是未知参数,分别称为回归常数和偏回归系数,ε称为随机误差,是一个随机变量,且同样满足两个前提条件: E(ε)=0 var(ε)=σ2;回归参数的普通最小二乘估计(OLSE) 线性回归方程确定后的任务是利用已经收集到的样本数据,根据一定的统计拟合准则,对方程中的各参数进行估计。普通最小二乘就是一种最为常见的统计拟合准则。 最小二乘法将偏差距离定义为离差平方和,即 最小二乘估计就是寻找参数β0 、β1、… βp的估计值β?0 、β ?1、… β ?p,使式(1)达到极小。通过求极值原理(偏导为零)和解方程组,可求得估计值,SPSS将自动完成。;回归方程的统计检验 回归方程的拟合优度检验(相关系数检验) 一元线性回归的拟合优度检验采用R2统计量,称为判定系数或决定系数,数学定义为;回归方程的统计检验 回归方程的拟合优度检验(相关系数检验) R2取值在0-1之间, R2越接近于1,说明回归方程对样本数据点的拟合优度越高。;多元线性回归的拟合优度检验采用 统计量,称为调整的判定系数或调整的决定系数,数学定义为;回归方程的统计检验 回归方程的显著性检验(F检验);回归方程的统计检验 回归方程的显著性检验(F检验);回归方程的统计检验 回归系数的显著性检验(t检验);回归方程的统计检验 回归系数???显著性检验(t检验);回归方程的统计检验 残差分析;回归方程的统计检验 残差分析——均值为0的正态性分析;回归方程的统计检验 残差分析——独立性分析 绘制残差序列的序列图 以样本期(或时间)为横坐标,残差为纵坐标,如果残差随时间的推移呈规律性变化,则存在一定的正或负相关性。 计算残差的自相关系数 取值在-1到+1之间,接近于+1表明序列存在正自相关性。 DW(Durbin—Watson)检验 DW取值在0至4之间,直观判断标准是DW=4,残差序列完全负自相关;DW=2,完全无自相关;DW=0,完全正自相关。;回归方程的统计检验 残差分析——异方差分析 绘制残差图 如果残差的方差随着解释变量值的增加呈增加(或减少)的趋势,说明出现了异方差现象。;回归方程的统计检验 残差分析——异方差分析 等级相关分析 得到残差序列后首先对其取绝对值,然后计算出残差和解释变量的秩,最后计算Spearman等级相关系数,并进行等级相关分析。具体过程见相关分析相关章节。;回归方程的统计检验 残差分析——探测样本中的异常值和强影响点(对于y值) 标准化残差ZRE 由于残差是服从均值为0的正态分布,因此可以根据3σ准则 进行判断,首先对残差进行标准化 ,绝对值大于3对应的观察值为异常值。 学生化残差SRE 剔除残差DRE(或剔除学生化残差SDRE) 上述SRE、SDRE的直观判断标准同标准化残差ZRE。;回归方程的统计检验 残差分析——探测样本中的异常值和强影响点(对于x值) 杠杆值hii SPSS中计算的是中心化杠杆值chii,通常如果chii大于2或3倍的chii的均值(p/n),则认为观察点为强影响点。 库克距离Di 库克距离是杠杆值与残差大小的综合效应,一般库克距离大于1,则可认为观察点为强影响点。 标准化回归系数的变化和标准化预测值的变化 如果标准化回归系数变化的绝对值大于 ,或标准化预测值变化的绝对值大于 ,则可认为第i个样本可能是强影响点。 ;多元回归分析中的其他问题 变量筛选问题 向前筛选策略 解释变量不断进入回归方程的过程,首先选择与被解释变量具有最高线性相关系数的变量进入方程,并进行各种检验;其次在剩余的变量中挑选与解释变量偏相关系数最高并通过检验的变量进入回归方程。 向后筛选策略 变量不断剔除出回归方程的过程,首先所

文档评论(0)

1亿VIP精品文档

相关文档