- 6
- 0
- 约2.97千字
- 约 30页
- 2019-08-19 发布于辽宁
- 举报
下页 返回 上页 下页 返回 一元线性回归分析 内容简介: 建立一元线性回归分析的理论与方法, 其中得到了线性回归方程, 重点讨论线性回归方程的显著性, 研究点预测和区间预测问题. 一元线性回归分析方法在解决实际问题中非常重要, 是数据统计分析的常用方法,在科技论文中常用. 这部分高中学过. 现在重点学习线性相关性检验和预测问题. 第九章 回归分析 9.2 一元线性回归分析 一、问题提出 在一元线性回归分析中, 有两个变量, 其中X是可观测、可控制的普通变量, Y 为随机变量. 如何寻找和判定Y 与X 之间是否存在着显著的线性相关关系呢? 如果存在, 我们将如何利用它们的线性关系进行预测和控制呢? 如,子女身高与父母身高是否存在着某种统计规律? 产品强度是否与温度有关系? 9.2.2 预备知识 最小二乘法, 检验统计量, 参数假设检验方法, 置信区间. 前面我们曾提到,在一元线性回归分析中,有两个变量, 其中X是可观测、可控制的普通变量, 常称它为自变量或控制变量,Y 为随机变量, 常称其为响应变量. 通过散点图可以判定Y与X之间是否存在着显著的线性相关关系, 即Y与X之间存在如下关系: (9.2.1) 9.2.3 建立理论 1. 一元正态回归模型 通常认为 ~N(0, )且假设 与X无关. 将观测数据 (i=1, 2,…, n)代入 (9.2.1)式,再注意样本为简单随机样本, 得 称(9.2.2)式所确定的模型为一元线性回归模型, 对其进行统计分析称为一元线性回归分析. 相互独立且同分布 (9.2.2) 不难理解, 在模型(9.2.1)中, E(Y)=a+bx. 若记y=E(Y), 则我们 得到关系式y= a+bx, 此等式就是所谓的一元线性回归方程, 其图像就是回归直线, b为回归系数, a称为回归常数, 也称为回归系数. 现讨论如何根据观测值 (i=1,2,…,n)估计模型(9.2.2) 中回归函数 f(X) =a+bx的回归系数. 采用最小二乘法, 记平方和 (9.2.3) 我们寻找使Q(a, b)达到最小的a,b作为其 估计, 即 为此, 对Q(a, b)求偏导, 令 化简, 得到如下方程组 (称为模型的正规方程组), 解得, (9.2.4) 称 为Y关于X 的经验回归直线方程 或经验公式, 其图形称为回归直线. (9.2.4)式 分别称为a,b的最小二乘估计值,将其中的y改写为随机变量Y, 就得到 a, b的最小二乘估计量. (9.2.4)式中 *例9.2.1 某种合成纤维的强度与 其拉伸倍数有关. 下表是24个纤维样品 的强度与相应的拉伸倍数的实测记录. 试求这两个变量间的经验公式. 编号 1 2 3 4 5 6 7 8 9 10 11 12 拉伸倍数X 1.9 2.0 2.1 2.5 2.7 2.7 3.5 3.5 4.0 4.0 4.5 4.6 强度Y (Mpa) 1.4 1.3 1.8 2.5 2.8 2.5 3.0 2.7 4.0 3.5 4.2 3.5 编号 13 14 15 16 17 18 19 20 21 22 23 24 拉伸倍数X 5.0 5.2 6.0 6.3 6.5 7.1 8.0 8.0 8.9 9.0 9.5 10 强度Y (Mpa) 5.5 5.0 5.5 6.4 6.0 5.3 6.5 7.0 8.5 8.0 8.1 8.1 解 从本例的散点图看出(见图9-1), 强度Y与拉伸倍数x之间大致呈现线性 相关关系, 因此一元线性回归模型是适用Y与x的. 图9-1 例9.2.1数据散点图 现用公式(9.2.4)求 , 这里n=24, 由此得到强度Y 与拉伸倍数X 之间的 经验公式为 2. 线性相关性的检验 前面的讨论都是在假设Y 与X 呈现线性相关关系的前提下进行的, 若这个假设不成立, 则我们建立的经验回归直线方程也就完全失去实际意义. 为此必须对Y与X之间的线性相关关系作出理论上的检验. (1) 偏差平方和分解及其实际意义 已知 , 将其中的 改写为 , 改写为 ,并记 人们称它为总偏差平方和, 它反映数据 的 总波动. 简单计算,易得 有如下分解式: 其中 称为回归平方和, 它反映了回归方程 的理论值 对 平均值的离散程度.
原创力文档

文档评论(0)