回归剖析部分.pptVIP

  • 0
  • 0
  • 约6.77千字
  • 约 74页
  • 2020-03-26 发布于福建
  • 举报
多元统计课程设计 之 回归剖析;线性回归模型;回归模型基本假设;回归模型基本假设;对线性回归模型通常要研究问题;正态假设下, 参数最小二乘估计(OSLE) 与极大似然估计(MLE)一致,即若线性回归 模型为 ,其中 则有 ,可得 ;若称 为 残差。则误差 项方差 无偏估计为;回归剖析步骤;确定模型变量; 一是由于认识有局限性,我们不可能完全 了解对被解释变量有重要影响全部因素。 二是为了模型参数估计有效性,设置 解释变量之间应该是不相关。 三是我们从经济关系角度考虑非常重要 变量应该引进, 但在实际中并没有这样统计 数据。 这一点在我国建立经济模型时经常会遇 到。这时可以考虑用相近变量代替,或者由 其他几个指标复合成一个新指标。;注: 1.不要认为一个回归模型中解释变量越多越好。 可能选取与问题无关变量,也可能由于一 些变量具有较强相关性,他们所反映信息 有较严重重叠,即出现共线性问题。 另当 变量太多,计算工作量太大,计算误差积累 也大,估计出模型参数精度自然不高。 2.回归变量一般一次并不能完全确定,通常要 经过反复试算,最终找出最合适一些变量。;收集、整理统计数据;常用样本数据分为时间序列数据与横截面数据 时间序列数据——按时间顺序排列统计数据。 对于时间序列数据要注意数据可比性与数 据统计口径问题。 时间序列数据容易产生模型中随机误差项 序列相关,这是因为许多经济变量前后期之间 总是有关联。 对于具有随机误差项序列相关情况,要通 过对数据某种计算整理来消除序列相关性,最 常用处理方法是差分法。 ;横截面数据——在同一时间截面上统计数据。 用横截面数据作为样本时,容易产生异方 差性。 对于具有异方差性建模问题,数据整理 就要注意消除异方差性,这常与模型参数估计 方法结合起来考虑。 时间序列结合横截面数据形成面板数据, 由协 整剖析专门处理;样本容量选择 无论是时间序列数据还是横截面数据,样 本容量多少一般要与设置解释变量数目相 配套。通常为了使模型参数估计更有效,要 求样本容量n大于解释变量个数p。当np 时,普通OLSE方法失效。 n与p比例 据英国统计学家M.Kendall,n应是p10 倍。这有时很难做到,但在收集数据时,应尽 可能多收集一些样本数据。;统计数据整理 统计数据整理中不仅要把一些变量数据 进行折算、差分,甚至把数据对数化、标准化 等,有时还须注意剔除个别特别大或特别小 “野值”。在统计数据质量不高时,经常会遇到 这种情况。当然,有时还须利用插值方法把 空缺数据补齐。;确定回归模型数学形式;经济回归模型建立,通常要依据经济理论与一些数理经济学结果。 有时,我们无法根据现有资料确定模型形式, 这时可以采用不同形式进行计算机模拟,对于不同模拟结果,选择较好一个做为理论模型。 尽管模型中待估未知参数要等到参数估计、检验之后才能确定,但在很多情况下,可根据实际问题对未知参数正负及大小范围事先给予确定。;模型参数估计;对于一元线性回归模型,在满足模型基本假定条件下,我们可以求得 ;由上述计算结果,回归系数 波动不仅与随 机误差方差 有关,而且还与自变量x取值 离散程度有关。如果x取值比较分散,即x 波动较大,则 波动就小, 估计值 就 比较稳定。反之,若原始数据x是在一个较小 范围内取值,则 估计值稳定性就差。 而回归常数 方差也不仅与随机误差方差 与自变量x取值离散程度有关,而且还同样本 数据个数n有关。显然数据n越大时,方差越 小。;对于多元回归模型,也有类似结论。 为了使未知参数估计值更稳定,在收集数据时,就应该考虑x取值尽可能分散一些,不要挤在一块,样本量也应尽可能大一些,样本量n太小时,估计量稳定性肯定不会太好。;模型检验;回归方程显著F检验;回归系数显著性t检验; 由于某些自变量不显著,因而在多元回归中并不 是包含在回归方程中自变量越多越好,可采用逐步 回归方法,也可采用一种简单剔除多余变量方 法——后退法。 当有多个自变量对因变量y无显著性影响时,由于 自变量之间交互作用,不能一次剔除掉所有不显著 变量。原则上每次只剔除一个变量,先剔除其中t 绝对值最小(或P值最大)一个变量,然后再对 求得新回归方程进行检验,有不显著变

文档评论(0)

1亿VIP精品文档

相关文档