研究生 统计学讲义 第11讲 相关与回归.ppt

研究生 统计学讲义 第11讲 相关与回归

最佳直线拟合 一旦确定适合作回归分析, 就是要确定哪一条直线最能拟合数据. 在下图拟合了a,b,c三条直线. 很明显, c 拟合数据比a 和b 更好. 这些数据有正的倾向: 随X的增加, Y也增加. 而直线 b 完全不能够反映 Y 和 X 之间的关系, 而且这条线暗指不存在关系. 图6.7 如何确定哪条线最好拟合这些数据呢? 在图6.8 里,考虑相同数据和两条直线c与d.这个时候两条直线都顺着直线的正向.为讨论这些直线哪条最能拟合数据──或者是否有一些其它直线能更好地拟合──需要某些我们能够判断其拟合的准则.为了产生最满意的直线,下面我们制定这个准则和方法. 回归的目的是预测 Y 的值.开始瞬间,忽略变量 X,按照前面单样本分析进行思考.Y的预测值将是E (Y)=μY ,通过使用样本平均值 进行估计.该直线有方程 .见图7.9,我们使用记号 (念作“Y hat ”)而不是用Y去表示它的预测值,预测值不是精确值或观察值.直线 的斜率为0,即它平行于x 轴.作为 ,它意味着Y 和X 之间没有关系,因为Y的值不依赖(随着变化的)X 值. 图6.9 对数据拟合 然而在下面,我们认为Y的值不依赖 X 的取值,而且我们能够度量 Y 的精确值Yi 和 Y 的预测值

文档评论(0)

1亿VIP精品文档

相关文档