SAS线性回归分析案例 2009版.pdfVIP

  • 22
  • 0
  • 约8.58千字
  • 约 13页
  • 2017-06-27 发布于河北
  • 举报
SAS线性回归分析案例 2009版

线性回归 陈磊 计算2 SouthWest JiaoTong University 线性回归分为一元线性回归和多元线性回归。 一元线性回归的模型为Y = + X +ε,这里X 是自变量,Y 是因变量,ε是随机误差项。 0 1 2 2 2 通常假设随机误差的均值为0,方差为 ( 0), 与X 的值无关。若进一步假设随机误 差服从正态分布,就叫做正态线性模型。一般情况,设有k 个自变量和一个因变量,因变量的 值可以分解为两部分:一部分是由于自变量的影响,即表示为自变量的函数,其中函数形式已 知,但含有一些未知参数;另一部分是由于其他未被考虑的因素和随机性的影响,即随机误差。 当函数形式为未知参数的线性函数时,称为线性回归分析模型。 如果存在多个因变量,则回归模型为:Y = + X + X + ⋯+X +。由于直线模 0 1 1 2 2 i i 型中含有随机误差项,所以回归模型反映的直线是不确定的。回归分析的主要目的是要从这些 不确定的直线中找出一条最能拟合原始数据信息的直线,并将其作为回归模型来描述因变量和 自变量之间的关系,这条直线被称为回归方程。 通常在回归分析中,对ε有以下最为常用的经典假设。 1、ε的期望值为0. 2、ε对于所有的X 而言具有同方差性。 3、ε是服从正态分布且相互独立的随机变量。 对线性回归的讲解,本文以例题为依托展开。在下面的例题中既有一元回归分析,又有二 元回归分析。 例题 (《数据据分析方法》_习题2.4_page79) 某公司管理人员为了解某化妆品在一个城市的月销量Y (单位:箱)与该城市中 适合使用该化妆品的人数 (单位:千人)以及他们人均月收入 (单位:元)之间 1 2 的关系,在某个月中对15 个城市作了调查,得到上述各量的观测值如表2.12 所示。 表2.12 化妆品销售数据 城市 销量(y) 人数(x1) 收入(x2) 城市 销量(y) 人数(x1) 收入(x2) 1 162 274 2450 9 116 195 2137 2 120 180 3254 10 55 53 2560 3 223 375 3802 11 252 430 4020 4 131 205 2838 12 232 372 4427 5 67 86 2347 13 144 236 2660 6 169 265 3782 14 103 157 2088 7 81 98 3008 15 212 370 2605 8 192 330 2450 假设Y 与 , 之间满足线性回归关系 1 2 = + + + , = 1,2, …,15 0 1 1 2 2 2 其中 独立同分布于(0, ).

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档