- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第15章预测
我们可以从图15-14中得出什么初步结论呢?学生人数较多的校园周边的饭店销售额较大。同时,两个变量之间的关系近似一条直线,而且x和y表现出正相关性。在图15-15中我们可以得出一条穿过所有数据、并为变量之间的关系提供良好现行近似的直线。仔细观察可发现这种线性关系并不完美,事实上,很少有数据正好落在直线上。然而,如果我们能推导出一个数学表达式来表示这条直线,我们仍然可以利用这个表达式来预测与相应的各种可能的x值相对应的y值。这个数学表达式被称为估计回归等式。 使用最小二乘法,我们推导出回归方程为: 其中, ——非独立变量的估计值(季度销售额) b0——估计回归方程截距; b1 ——估计回归方程斜率; x——自变量(学生人数)。 (15-10) ——自变量的平均值; ——因变量的平均值; n——观察个数。 我们用下列表达式来计算截距b0与斜率b1; (15-11) (15-12) 其中, xi——第i个自变量;yi—第i个因变量; 表15-14中显示了推导学生人数和季度销售额之间的最小二乘法估计回归方程的一些必要数据。我们这个例子包括10家饭店或者说观察值;因此,n=10。利用式(15-11)和式(15-12)来计算斜率b1如下: 然后计算截距b0 ,过程如下: 这一方程如图15-16。 因此,利用最小二乘法求得的估计回归方程如下: 估计的回归方程的斜率(b1=5)为正,这意味着当学生人数上升时,季度销售额便会增加。事实上,我们可以得出如下结论:学生人数增加1000,预期季度销售额增加5000美元(学生人数的单位是1000个,季度销售额的单位是1000美元);也就是说,预计季度销售额以每个学社5美元的速度增加。 如果我们认为最小二乘法估计出来的回归方程充分地描述了x与y之间的关系,那么利用估计回归方程来预测给定x条件下的y值将是合理的。例如,如果我们想预测一家坐落拥有16000个学生的校园附近、新开饭店的季度销售额,我们将计算如下: 图15-16 阿蒙德比萨饼屋的估计回归方程 表15-14 阿蒙德比萨饼屋的最小二乘法估计回归方程的计算过程 饭店(i) yi xi xiyi xi2 1 58 2 116 4 2 105 6 630 36 3 88 8 704 64 4 118 8 944 64 5 117 12 1404 144 6 137 16 2192 256 7 157 20 3140 400 8 169 20 3380 400 9 149 22 3278 484 10 202 26 5252 676 总计 1300 140 21040 2528 因此,我们预测出来的季度销售额为140 000美元。 阿蒙德比萨饼屋所面对的销售额预测问题表明了当时间序列数据部那么容易获得时,如何使用一元线性回归分析来进行预测。 如果拥有其他自变量数据的话,那么多元回归分析也可以用于一下这些情况。比如,假设阿蒙德比萨饼屋的管理层认为大学校园附近竞争者的数目也与季度销售额有关。直觉认为较少竞争者的校园附近的饭店会比那些有较多竞争者的校园附近的饭店有更好的销售业绩。通过额外的数据,多元回归分析可用于推导出与季度销售额、学生人数以及竞争者数据三者相关联的方程式。 15.5.2将回归分析与时间序列数据结合使用 在第15.3节中,我们拟合出自行车销售时间序列的线性趋势,说明如果知道时间序列的历史信息,就能用简单的线性回归分析预测时间序列的未来值。回顾一下这个问题,第t年的销售被设为因变量,而t被设为自变量。许多现实世界问题的内在复杂性使得我们必须考虑用更多的自变量来预测因变量。现在我们来看看在时间序列可得的情况下多元回归分析是如何应用于预测的。 利用多元回归分析,我们需要为因变量以及所有的自变量找出一组观察值样本。在时间序列的分析中,有n期时间序列数据为每个变量的n个观察值提供了一个样本。为了描述可能得出的基于回归模型的多样性,我们使用如下的标记法: Yt——期间t的时间序列的实际值; X1t——期间t的独立变量1的值; X2t——期间t的独立变量2的值; . . . Xkt——期间t的独立变量k的值。 推导估计回归方程所需的n期数据如下: 因变量 自变量 阶段 Yt x1t x2t x3t . . . xkt 1 Y1 x11 x21 x31 . . . xk1 2 Y2 x12 x22 x32 . . . xk2 ┇ ┇ ┇ ┇ ┇ ┇ ┇ ┇ ┇ n Yn x1n x2n x3n . .
文档评论(0)