- 2
- 0
- 约4.2千字
- 约 26页
- 2020-08-01 发布于天津
- 举报
复习回顾 1 、线性回归模型: y=bx+a+e , 其中 a 和 b 为模型的未知参数, e 称为随机误差 。 2 、数据点和它在回归直线上相应位置的差异 是随机误差的效应,称 为 残差 。 $ ) i i y y ? ( $ i i i e y y ? $ = 3 、对每名女大学生计算这个差异,然后分别将所得 的值平方后加起来,用数学符号表示为: 称为 残差平方和 ,它代表了随机误差的效应。 $ 2 1 ( ) n i i i y y ? ? ? 刻画模型拟合的精度 相关指数: 2 2 1 2 1 ? ( ) 1 ( ) n i i i n i i y y R y y ? ? ? ? ? ? ? ? R 2 取值越大,则残差平方和越小,即模型的拟合效果 越好 . 1) 确定解释变量和预报变量 ; 2) 画出散点图 ; 3) 确定回归方程类型 ; 4) 求出回归方程 ; 5) 利用相关指数或残差进行分析 . 建立回归模型的基本步骤 回归分析 1. 从一组样本数据出发,确定变量之间的数学 关系式 2. 对这些关系式的可信程度进行各种统计检验, 并从影响某一特定变量的诸多变量中找出哪 些变量的影响显著,哪些不显著 3. 利用所求的关系式,根据一个或几个变量的 取值来预测或控制另一个特定变量的取值, 并给出这种预测或控制的精确程度 回归分析与相关分析的区别 1. 相关分析中,变量 x 变量 y 处于平等的地位;回 归分析中,变量 y 称为因变量,处在被解释的地 位, x 称为自变量,用于预测因变量的变化 2. 相关分析中所涉及的变量 x 和 y 都是随机变量; 回归分析中,因变量 y 是随机变量,自变量 x 可 以是随机变量,也可以是非随机的确定变量 3. 相关分析主要是描述两个变量之间线性关系的密 切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制 问题: 一只红铃虫的产卵数 y 与温度 x 有关 , 现收 集了 7 组观测数据 , 试建立 y 与 x 之间的回归方程 温度 x 21 23 25 27 29 32 35 产卵数 y 7 11 21 24 66 115 325 解 :1) 作散点图 ; 0 50 100 150 200 250 300 350 20 22 24 26 28 30 32 34 36 温度 产 卵 数 从散点图中可以看出产卵数和温度之间的关系并不能 用线性回归模型来很好地近似。这些散点更像是集中 在一条指数曲线或二次曲线的附近。 选变量 解:选取气温为解释变量 x ,产卵数 为预报变量 y 。 画散点图 假设线性回归方程为 : ?=bx+a 选 模 型 分析和预测 当 x =28 时, y = 19.87 × 28- 463.73≈ 93 估计参数 由计算器得:线性回归方程为 y= 19.87 x -463.73 相关指数 R 2 = r 2 ≈0.864 2 =0.7464 所以,一次函数模型中温度解释了 74.64% 的产卵数变化。 探索新知 0 50 100 150 200 250 300 350 0 3 6 9 12 15 18 21 24 27 30 33 36 39 方案 1 当 x =28 时, y = 19.87 × 28- 463.73≈ 93 一元线性模型 奇 怪 ? 9366 ? 模型不好? y=bx 2 +a 变换 y=bt+a 非线性关系 线性关系 方案 2 问题1 选用 y=bx 2 +a ,还是 y=bx 2 +cx+a ? 问题 3 -200 -100 0 100 200 300 400 -40 -30 -20 -10 0 10 20 30 40 产卵数 气 温 问题 2 如何求 a 、 b ? 合作探究 t=x 2 二次函数模型 方案 2 解答 平方变换 : 令 t=x 2 ,产卵数 y 和温度 x 之间二次函数模型 y=bx 2 +a 就转化为产卵数 y 和温度的平方 t 之间线性回归模型 y=bt+a 温度 21 23 25 27 29 32 35 温度的平方 t 441 529 625 729 841 1024 1225 产卵数 y / 个 7 11 21 24 66 115 325 作散点图,并由计算器得: y 和 t 之间的线性回归方程为 y= 0.367 t -202.54 ,相关指数 R 2 = r 2 ≈ 0.896 2 =0.802 将 t=x 2 代入线性回归方程得: y= 0.367 x 2 -202.54 当 x =28 时 , y =0.367 × 28 2 -
原创力文档

文档评论(0)