03系统预测方法-回归.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
回归分析是应用最为广泛的定量分析方法之一,既可以用来进行评价,也可以用来进行预测。回归分析是一种对于变量间非确定关系的统计分析方法,它根据存在于现象之间的内在因果关系和函数关系建立模型,用来从一种现象的变动去估计另一种现象的变动方向和程度. ▲注意: 该样本的散点图 3.2.1 多元线性回归模型 现实生活中引起被解释变量变化的因素并非仅只一个解释变量,可能有很多个解释变量。 例如,产出往往受各种投入要素——资本、劳动、技术等的影响;销售额往往受价格和公司对广告费的投入的影响等。 所以在一元线性模型的基础上,提出多元线性模型——解释变量个数≥ 2 1.多元线性回归模型表示方法 多元回归模型:含两个以上解释变量的回归模型 多元线性回归模型:一个应变量与多个解释变量之间设定的是线性关系 多元线性回归模型一般形式为: 矩阵形式: 独立性:给定 条件下, 的条件期望值E( )=0,即零均值假设; 等方差:对于所有 , 的条件方差同为常数 ,即Var( / )= ; 正态性:随机误差项服从均值0、方差为 的正态分布; 不相关性:解释变量 Xi 是确定性变量,不是随机变量;解释变量之间互不相关,即无多重共线性。 无自相关:随机误差项与解释变量之间不相关 构建回归模型过程中运用多种检验手段,均是为了使模型满足假设理论。 3.方程的检验方法 1)变量相关性检验 可利用: 多重可决系数的矩阵表示: 修正的可决系数 (2)可决系数的修正方法 修正的可决系数 与可决系数 的关系 2)回归方程的显著检验--F检验 3)回归系数显著性检验---t 检验 4)残差独立性检验 ①DW检验 假设理论中随机误差项 之间的无自相关性不一定满足,即可能存在序列相关,则将会使不是有效的估计量,因而必须对回归模型进行序列相关检验,以保证预测结果的有效性。 统计量DW= D≈2时(一般要求1.5—2.5)残差与自变量互为独立,0D2时相邻两点残差为正相关,2D4时相邻两点残差为负相关。 若 之间存在自相关性,则需通过数据变换消除。 ②散点图 以预测值 为横轴,以观测值与预测值的误差 - 为纵轴,作散点图。若散点呈随机分布即残差分布为常数,则认为残差与因变量或自变量间相互独立;若散点呈现明显规律,则可能存在自相关、非线型、非常数方差等,需变换因变量或自变量的数据。 同时,若随机分布的散点大部分落在水平直线―2和2之间,则可以判断模型的拟合效果比较好。 5)残差正态性检验 ①残差直方图 残差直方图是以一组无间隔的直条图表现残差频数分布特征的统计图,其中每一条形的高度分别代表相应组别的频率。直方图可以展示正态分布曲线及其参数。图形显示越接近标准正态分布越好。 ②积累概率图 积累概率图是一种用来判断一个变量分布与一个指定分布是否符合的概率分布图。这里代表残差分布的曲线与代表正态分布的斜线重合程度越高,则两种分布的一致性越好。 6)自变量共线检验 ①共线性是指某个自变量与其他自变量的总体线性相关性。多元线性回归方法中应用最小二乘法估计模型参数的一个必要条件是自变量之间为不完全线性相关,若不满足,则可能出现回归系数值不可靠、回归系数符号与事理意义不符、有用变量被剔除等情况。 ②判断共线性使用统计量容许度和方差膨胀因子。 容许度Tolerance=1― ,其中Rj为xj与其他x间的复相关系数。容许度值越大,则自变量xj与其他自变量x间的共线性越弱,一般要求 。并且使用时要求观测量近似正态分布。 方差膨胀因子VIF=1/(1― )为容许度的倒数,一般认为,方差膨胀因子小于10是合理的。 ③消除共线性有几种常用的方法。 剔除不必要的自变量:从运用相关分析或聚类分析求得的一组高度相关的自变量中,剔除回归系数最小的、或检验值最小的、或系数符号与经济意义不符的变量。 自变量进行数据转换:有数学函数转换、观测值累加、自变量合并等方法,以及增加观测样本值、重新抽取样本数据、寻找新的自变量等方法。 (2)向后剔除法 首先建立一个包括所有自变量的多元线性回归方程,然后进行方差分析和各变量偏回归平方和的显著性检验,剔除偏回归平方和最小的不显著自变量,反复进行,直到只包含显著自变量为止。 (4)逐步回归法 按自变量对因变量的作用程度从大到小逐个引入回归方程,每引入一个变量同时检验方程中各个自变量的显著性,合格保留、不显著剔除,反复进行直到再没有显著的变量可以引入为止。 SPSS操作过程 操作(一) SPSS软件包逐步回归操作(二) 操作(三) 操作(四) 操作(五) 操作(六

文档评论(0)

精品资源 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档