第11章 一元线性回归 一元线性回归模型 基本假定 最小二乘估计 method of least squares 变差 因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面 由于自变量 x 的取值不同造成的 除 x 以外的其他因素 如x对y的非线性影响、测量误差等 的影响 对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示 误差平方和的分解 三个平方和的关系 误差平方和的分解 三个平方和的意义 总平方和 SST—total sum of squares 反映因变量的 n 个观察值与其均值的总误差 回归平方和 SSR—sum of squares of regression 反映自变量 x 的变化对因变量 y 取值变化的影 响,或者说,是由于 x 与 y 之间的线性关系引 起的 y 的取值变化,也称为可解释的平方和 残差平方和 SSE—sum of squares of error 反映除 x 以外的其他因素对 y 取值的影响,也 称为不可解释的平方和或剩余平方和 判定系数R2 coefficient of determination 1.回归平方和占总误差平方和的比例 估计标准误差 standard error of estimate 实际观察值与回归估计值误差平方和的均方根 反映实际观察值在回归直线周围的分散状况 对误差项?的标准差?的估计,是在排除了x对y的线性影响后,y随机波动大小的一个估计量 反映用估计的回归方程预测y时预测误差的大小 计算公式为 线性关系的检验 检验自变量与因变量之间的线性关系是否显著 将回归均方 MSR 同残差均方 MSE 加以比较,应用F检验来分析二者之间的差别是否显著 回归均方:回归平方和SSR除以相应的自由度 自变量的个数k 残差均方:残差平方和SSE除以相应的自由度 n-k-1 线性关系的检验 检验的步骤 提出假设 H0:?1 0 线性关系不显著 线性关系的检验 例题分析 提出假设 H0:?1 0 不良贷款与贷款余额之间的线性关系不显著 计算检验统计量F 线性关系的检验 方差分析表 回归系数的检验 检验步骤 提出假设 H0: 0 没有线性关系 H1: ? 0 有线性关系 计算检验的统计量 回归系数的检验 例题分析 ?对例题的回归系数进行显著性检验 ?=0.05 提出假设 H0: 0 H1: ? 0 计算检验的统计量 回归分析结果的评价 建立的模型是否合适?或者说,这个拟合的模型有多“好”?要回答这些问题,可以从以下几个方面入手 所估计的回归系数 的符号是否与理论或事先预期相一致 在不良贷款与贷款余额的回归中,可以预期贷款余额越多,不良贷款也可能会越多,也就是说,回归系数的值应该是正的,在上面建立的回归方程中,我们得到的回归系数为正值, 如果理论上认为x与y之间的关系不仅是正的,而且是统计上显著的,那么所建立的回归方程也应该如此 在不良贷款与贷款余额的回归中,二者之间为正的线性关系,而且,对回归系数的t检验结果表明而这之间的线性关系是统计上显著的 回归分析结果的评价 回归模型在多大程度上解释了因变量y取值的差异?可以用判定系数R2来回答这一问题 在不良贷款与贷款余额的回归中,得到的R2 71.16%,解释了不良贷款变差的2/3以上,说明拟合的效果还算不错 考察关于误差项?的正态性假定是否成立。因为我们在对线性关系进行F检验和回归系数进行t检验时,都要求误差项?服从正态分布,否则,我们所用的检验程序将是无效的。?正态性的简单方法是画出残差的直方图或正态概率图 Excel输出的部分回归结果 利用回归方程进行估计和预测 根据自变量 x 的取值估计或预测因变量 y的取值 估计或预测的类型 点估计 y 的平均值的点估计 y 的个别值的点估计 区间估计 y 的平均值的置信区间估计 y 的个别值的预测区间估计 点估计 y 的平均值的点估计 ?利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的一个估计值E y0 ,就是平均值的点估计 在前面的例子中,假如我们要估计贷款余额为100亿元时,所有分行不良贷款的平均值,就是平均值的点估计 。 区间估计 点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计 对于自变量 x 的一个给定值 x0,根据回归方程得到因变量 y 的一个估计区间 区间估计有两种类型 置信区间估计 confidence interval estimate 预测区间估计 prediction interval estimate 置信区间估计 利用估计的
原创力文档

文档评论(0)