第11章一元线性回归课题.ppt

第11章 一元线性回归 一元线性回归模型 (基本假定) 最小二乘估计 (method of least squares ) 变差 因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面 由于自变量 x 的取值不同造成的 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响 对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示 误差平方和的分解 (三个平方和的关系) 误差平方和的分解 (三个平方和的意义) 总平方和(SST—total sum of squares) 反映因变量的 n 个观察值与其均值的总误差 回归平方和(SSR—sum of squares of regression) 反映自变量 x 的变化对因变量 y 取值变化的影 响,或者说,是由于 x 与 y 之间的线性关系引 起的 y 的取值变化,也称为可解释的平方和 残差平方和(SSE—sum of squares of error) 反映除 x 以外的其他因素对 y 取值的影响,也 称为不可解释的平方和或剩余平方和 判定系数R2 (coefficient of determination) 1.回归平方和占总误差平方和的比例 估计标准误差 (standard error of estimate) 实际观察值与回归估计值误差平方和的均方根 反映实际观察值在回归直线周围的分散状况 对误差项?的标准差?的估计,是在排除了x对y的线性影响后,y随机波动大小的一个估计量 反映用估计的回归方程预测y时预测误差的大小 计算公式为 线性关系的检验 检验自变量与因变量之间的线性关系是否显著 将回归均方(MSR)同残差均方(MSE)加以比较,应用F检验来分析二者之间的差别是否显著 回归均方:回归平方和SSR除以相应的自由度(自变量的个数k) 残差均方:残差平方和SSE除以相应的自由度(n-k-1) 线性关系的检验 (检验的步骤) 提出假设 H0:?1=0 线性关系不显著 线性关系的检验 (例题分析) 提出假设 H0:?1=0 不良贷款与贷款余额之间的线性关系不显著 计算检验统计量F 线性关系的检验 (方差分析表) 回归系数的检验 (检验步骤) 提出假设 H0: = 0 (没有线性关系) H1: ? 0 (有线性关系) 计算检验的统计量 回归系数的检验 (例题分析) ?对例题的回归系数进行显著性检验(?=0.05) 提出假设 H0: = 0 H1: ? 0 计算检验的统计量 回归分析结果的评价 建立的模型是否合适?或者说,这个拟合的模型有多“好”?要回答这些问题,可以从以下几个方面入手 所估计的回归系数 的符号是否与理论或事先预期相一致 在不良贷款与贷款余额的回归中,可以预期贷款余额越多,不良贷款也可能会越多,也就是说,回归系数的值应该是正的,在上面建立的回归方程中,我们得到的回归系数为正值, 如果理论上认为x与y之间的关系不仅是正的,而且是统计上显著的,那么所建立的回归方程也应该如此 在不良贷款与贷款余额的回归中,二者之间为正的线性关系,而且,对回归系数的t检验结果表明而这之间的线性关系是统计上显著的 回归分析结果的评价 回归模型在多大程度上解释了因变量y取值的差异?可以用判定系数R2来回答这一问题 在不良贷款与贷款余额的回归中,得到的R2=71.16%,解释了不良贷款变差的2/3以上,说明拟合的效果还算不错 考察关于误差项?的正态性假定是否成立。因为我们在对线性关系进行F检验和回归系数进行t检验时,都要求误差项?服从正态分布,否则,我们所用的检验程序将是无效的。?正态性的简单方法是画出残差的直方图或正态概率图 Excel输出的部分回归结果 利用回归方程进行估计和预测 根据自变量 x 的取值估计或预测因变量 y的取值 估计或预测的类型 点估计 y 的平均值的点估计 y 的个别值的点估计 区间估计 y 的平均值的置信区间估计 y 的个别值的预测区间估计 点估计 y 的平均值的点估计 ?利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的一个估计值E(y0) ,就是平均值的点估计 在前面的例子中,假如我们要估计贷款余额为100亿元时,所有分行不良贷款的平均值,就是平均值的点估计 。 区间估计 点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计 对于自变量 x 的一个给定值 x0,根据回归方程得到因变量 y 的一个估计区间 区间估计有两种类型 置信区间估计(confidence interval estimate) 预测区间估计(predict

文档评论(0)

1亿VIP精品文档

相关文档