第八章相关与回归讲稿.ppt

四、一元线性回归方程的统计检验 (一)拟合优度检验 1、总离差平方和的分解 总离差平方和 = 回归离差平方和 + 残差平方和 对于一个拟合效果较好的回归方程,总离差平方和与回归离差平方和应该比较接近。 TSS=RSS+ESS 总离差平方和 回归平方和 误差平方和 误差平方和 回归 平方和 总离差平方和 确定回归直线后,需要评价这一直线方程是否有效地反映了这两变量之间的关系。评价回归方程配合好坏的一个主要指标是判定系数(或称确定系数) 是相关系数的平方,用 表示;用来衡量回归方程对y的解释程度。 判定系数取值范围: 越接近于1,表明x与y之间的相关性越强; 越接近于0,表明两个变量之间几乎没有直线相关关系. 2、判定系数 判定系数 r2 表示全部偏差中有百分之几的偏差可由x与y的回归关系来解释 r 的符号同 b 判定系数的计算公式 判定系数与相关系数的关系 学生 身高 体重 估计值 A B C D E F G H I J 158 160 162 164 166 168 170 172 174 176 47 50 48 55 62 60 52 61 70 65 24964 25600 26244 26896 27556 28224 28900 29584 30276 30976 2209 2500 2304 3025 3844 3600 2704 3721 4900 4225 7426 8000 7776 9020 10292 10080 8840 10492 12180 11440 47.29 49.45 51.61 53.76 55.92 58.08 60.24 62.39 64.55 66.71 -9.71 -7.55 -5.39 -3.24 -1.08 1.08 3.24 5.39 7.55 9.71 -10 -7 -9 -2 5 3 -5 4 13 8 1670 570 279220 33032 95546 - 0 0 判定系数与相关系数的区别: 判定系数无方向性,相关系数则有方向,其方向与样本回归系数 b 相同; 判定系数说明变量值的总离差平方和中可以用回归线来解释的比例,相关系数只说明两变量间关联程度及方向; 相关系数有夸大变量间相关程度的倾向,因而判定系数是更好的度量值。 判定系数仅能说明回归方程对样本观察值拟合程度的高低,却不能表明回归直线估计值与各实际观察值的绝对离差的数额。估计标准误差正是反映回归直线代表性高低的指标。用syx表示估计标准误差,其计算公式如下: 3、估计标准误差 n-2 表示残差平方和的自由度,对于回归直线而言,Syx 值越小,所有样本观察点越靠近回归直线,即回归直线拟合程度好,代表性高; Syx 值越大,则说明回归直线拟合不好,代表性差。 回归分析中我们最关心的是: X 与 Y 是否有真正的相关关系。即: (二)线性回归方程的显著性检验 1、回归系数b的显著性检验 (1)提出假设; (2)构造检验统计量; (3)根据给定的显著性水平和自由度(n-2),确定临界值; (4)确定原假设的拒绝规则; (5)计算检验统计量并做出决策。 统计理论已经证明 学生 身高 体重 估计值 A B C D E F G H I J 158 160 162 164 166 168 170 172 174 176 47 50 48 55 62 60 52 61 70 65 24964 25600 26244 26896 27556 28224 28900 29584 30276 30976 2209 2500 2304 3025 3844 3600 2704 3721 4900 4225 7426 8000 7776 9020 10292 10080 8840 10492 12180 11440 47.29 49.45 51.61 53.76 55.92 58.08 60.24 62.39 64.55 66.71 -9.71 -7.55 -5.39 -3.24 -1.08 1.08 3.24 5.39 7.55 9.71 -10 -7 -9 -2 5 3 -5 4 13 8 1670 570 279220 33032 95546 - 0 0 检验统计量落入拒绝域中,故拒绝原假设,接受备择假设。即可以认为 b 明显地不等于零,X 与 Y 是显著的。 F检验是基于F分布进行的,是方差分析内容之一。 方差来源 平方和 自由度 均方 F值 回归 误差 总计 RSS ESS TSS 1 n-2 n-1 均方回归 均方误差 2、回归方程的显著性检验(F 检验) 当 ?1 = 0 时,

文档评论(0)

1亿VIP精品文档

相关文档