回归剖析部分.pptVIP

下载本文档

0
0
约6.77千字
约 74页
2020-03-26 发布于福建
举报

回归剖析部分.ppt

多元统计课程设计之回归剖析;线性回归模型;回归模型基本假设;回归模型基本假设;对线性回归模型通常要研究问题;正态假设下，参数最小二乘估计（OSLE）与极大似然估计（MLE）一致，即若线性回归模型为，其中则有，可得 ;若称为残差。则误差项方差无偏估计为;回归剖析步骤;确定模型变量; 一是由于认识有局限性，我们不可能完全了解对被解释变量有重要影响全部因素。二是为了模型参数估计有效性，设置解释变量之间应该是不相关。三是我们从经济关系角度考虑非常重要变量应该引进，但在实际中并没有这样统计数据。这一点在我国建立经济模型时经常会遇到。这时可以考虑用相近变量代替，或者由其他几个指标复合成一个新指标。;注： 1.不要认为一个回归模型中解释变量越多越好。可能选取与问题无关变量，也可能由于一些变量具有较强相关性，他们所反映信息有较严重重叠，即出现共线性问题。另当变量太多，计算工作量太大，计算误差积累也大，估计出模型参数精度自然不高。 2.回归变量一般一次并不能完全确定，通常要经过反复试算，最终找出最合适一些变量。;收集、整理统计数据;常用样本数据分为时间序列数据与横截面数据时间序列数据——按时间顺序排列统计数据。对于时间序列数据要注意数据可比性与数据统计口径问题。时间序列数据容易产生模型中随机误差项序列相关，这是因为许多经济变量前后期之间总是有关联。对于具有随机误差项序列相关情况，要通过对数据某种计算整理来消除序列相关性，最常用处理方法是差分法。 ;横截面数据——在同一时间截面上统计数据。用横截面数据作为样本时，容易产生异方差性。对于具有异方差性建模问题，数据整理就要注意消除异方差性，这常与模型参数估计方法结合起来考虑。时间序列结合横截面数据形成面板数据，由协整剖析专门处理;样本容量选择无论是时间序列数据还是横截面数据，样本容量多少一般要与设置解释变量数目相配套。通常为了使模型参数估计更有效，要求样本容量n大于解释变量个数p。当np 时，普通OLSE方法失效。 n与p比例据英国统计学家M.Kendall，n应是p10 倍。这有时很难做到，但在收集数据时，应尽可能多收集一些样本数据。;统计数据整理统计数据整理中不仅要把一些变量数据进行折算、差分，甚至把数据对数化、标准化等，有时还须注意剔除个别特别大或特别小 “野值”。在统计数据质量不高时，经常会遇到这种情况。当然，有时还须利用插值方法把空缺数据补齐。;确定回归模型数学形式;经济回归模型建立，通常要依据经济理论与一些数理经济学结果。有时，我们无法根据现有资料确定模型形式，这时可以采用不同形式进行计算机模拟，对于不同模拟结果，选择较好一个做为理论模型。尽管模型中待估未知参数要等到参数估计、检验之后才能确定，但在很多情况下，可根据实际问题对未知参数正负及大小范围事先给予确定。;模型参数估计;对于一元线性回归模型，在满足模型基本假定条件下，我们可以求得 ;由上述计算结果，回归系数波动不仅与随机误差方差有关，而且还与自变量x取值离散程度有关。如果x取值比较分散，即x 波动较大，则波动就小，估计值就比较稳定。反之，若原始数据x是在一个较小范围内取值，则估计值稳定性就差。而回归常数方差也不仅与随机误差方差与自变量x取值离散程度有关，而且还同样本数据个数n有关。显然数据n越大时，方差越小。;对于多元回归模型，也有类似结论。为了使未知参数估计值更稳定，在收集数据时，就应该考虑x取值尽可能分散一些，不要挤在一块，样本量也应尽可能大一些，样本量n太小时，估计量稳定性肯定不会太好。;模型检验;回归方程显著F检验;回归系数显著性t检验; 由于某些自变量不显著，因而在多元回归中并不是包含在回归方程中自变量越多越好，可采用逐步回归方法，也可采用一种简单剔除多余变量方法——后退法。当有多个自变量对因变量y无显著性影响时，由于自变量之间交互作用，不能一次剔除掉所有不显著变量。原则上每次只剔除一个变量，先剔除其中t 绝对值最小（或P值最大）一个变量，然后再对求得新回归方程进行检验，有不显著变

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

回归剖析部分.pptVIP