11(上课用)回归分析的基本思想及其初步应用.pptVIP

  • 5
  • 0
  • 约3.94千字
  • 约 54页
  • 2016-12-12 发布于重庆
  • 举报

11(上课用)回归分析的基本思想及其初步应用.ppt

最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。 相关关系的测度 (相关系数取值及其意义) 某运动员训练次数与运动成绩之间的数据关系如下: 残差图 第四步:计算相关指数 以样本编号为横坐标的残差图: 异常点 是否为错误数据?残差图中的残差点比较均匀地落在水平的带状区域,说明选用的模型比较合适。区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。 注:在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方.这表明“身高解释了64%的体重变化”,或者说“体重的差异有64%是有身高引起的” (而随机误差贡献了剩余的36%,所以,身高对体重的效应比随机误差的效应大得多,可以说身高和体重的相互关系较强) 例2.一只红铃虫的产卵数y和温度x有关,现收集了7组 观测数据列于下表中,试建立y与x之间的回归方程 325 115 66 24 21 11 7 产卵数y/个 35 32 29 27 25 23 21 温度x/oC 解:1)作散点图; 例2.一只红铃虫的产卵数y和温度x有关,现收集了7组 观测数据列于下表中,试建立y与x之间的回归方程 325 115 66 24 21 11 7 产卵数y/个 35 32 29 27 25 23 21 温度x/oC 解:1)作散点图;从散点图中可以看出产卵数和温度之间的关系并不能用线性回归模型来很好地近似。这些散点更像是集中在一条指数曲线或二次曲线的附近。 利用线性回归模型来建立y和x之间的非线性回归方程 5.784 4.745 4.190 3.178 3.045 2.398 1.946 z 35 32 29 27 25 23 21 x 例2.一只红铃虫的产卵数y和温度x有关,现收集了7组 观测数据列于下表中,试建立y与x之间的回归方程 325 115 66 24 21 11 7 产卵数y/个 35 32 29 27 25 23 21 温度x/oC 325 115 66 24 21 11 7 y 1225 1024 841 729 625 529 441 t 用残差来比较两个回归方程的拟合效果: 325 115 66 24 21 11 7 y 32.928 -14.153 8.889 -9.149 1.760 -0.167 0.518 77.965 -58.268 -40.107 -41.003 -5.835 19.397 47.693 35 32 29 27 25 23 21 x 前一个模型的拟合效果好 在一般情况下,比较两个模型的残差比较困难.原因是在某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反.这时可以通过比较两个模型的残差的平方和的大小来判断模型的拟合效果.残差平方和越小的模型,拟合的效果越好. 中残差平方和分别为1550.538和15448.431. 说明前面那个模型的拟合效果好 还可以用R2来比较两个模型的拟合效果.R2越 大,模型的拟合效果也越好. 中R2分别为0.98和0.80,说明前面那个模型的 拟合效果好 小结 实际问题样本分析回归模型 抽样 回归分析 预报精度 预报 51 48 46 42 39 37 34 30 成绩 50 46 44 39 37 35 33 30 次数 8 7 6 5 4 3 2 1 编号 试预测运动员训练47次以及55次的成绩 练习: * 1.1回归分析的基本思想及其初步应用 高二数学 选修1-2 景东一中侯灿 问题1:正方形的面积y与正方形的边长x之间的函数关系是 y = x2 确定性关系 问题2:某水田水稻产量y与施肥量x之间是否有一个确定性的关系? 例如:在 7 块并排、形状大小相同的试验田上进行施肥量对水稻产量影响的试验,得到如下所示的一组数据: 施化肥量x 15202530354045 水稻产量y 330 345365 405 445450 455 复习 变量之间的两种关系 1020304050 500 450 400 350 300 · · · · · · · 施化肥量x 15202530354045 水稻产量y 330 345365 405 445450 455 x y 施化肥量 水稻产量自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。 1、定义:1):相关关系是一种不确定性关系; 注 对具有相关关系的两个变量进行统计分析的方法叫回归分析。 2):

文档评论(0)

1亿VIP精品文档

相关文档