- 0
- 0
- 约6.77千字
- 约 74页
- 2020-03-26 发布于福建
- 举报
多元统计课程设计之回归剖析;线性回归模型;回归模型基本假设;回归模型基本假设;对线性回归模型通常要研究问题;正态假设下, 参数最小二乘估计(OSLE)
与极大似然估计(MLE)一致,即若线性回归
模型为 ,其中
则有 ,可得
;若称 为 残差。则误差
项方差 无偏估计为;回归剖析步骤;确定模型变量; 一是由于认识有局限性,我们不可能完全
了解对被解释变量有重要影响全部因素。
二是为了模型参数估计有效性,设置
解释变量之间应该是不相关。
三是我们从经济关系角度考虑非常重要
变量应该引进, 但在实际中并没有这样统计
数据。 这一点在我国建立经济模型时经常会遇
到。这时可以考虑用相近变量代替,或者由
其他几个指标复合成一个新指标。;注:
1.不要认为一个回归模型中解释变量越多越好。
可能选取与问题无关变量,也可能由于一
些变量具有较强相关性,他们所反映信息
有较严重重叠,即出现共线性问题。 另当
变量太多,计算工作量太大,计算误差积累
也大,估计出模型参数精度自然不高。
2.回归变量一般一次并不能完全确定,通常要
经过反复试算,最终找出最合适一些变量。;收集、整理统计数据;常用样本数据分为时间序列数据与横截面数据
时间序列数据——按时间顺序排列统计数据。
对于时间序列数据要注意数据可比性与数
据统计口径问题。
时间序列数据容易产生模型中随机误差项
序列相关,这是因为许多经济变量前后期之间
总是有关联。
对于具有随机误差项序列相关情况,要通
过对数据某种计算整理来消除序列相关性,最
常用处理方法是差分法。
;横截面数据——在同一时间截面上统计数据。
用横截面数据作为样本时,容易产生异方
差性。
对于具有异方差性建模问题,数据整理
就要注意消除异方差性,这常与模型参数估计
方法结合起来考虑。
时间序列结合横截面数据形成面板数据, 由协
整剖析专门处理;样本容量选择
无论是时间序列数据还是横截面数据,样
本容量多少一般要与设置解释变量数目相
配套。通常为了使模型参数估计更有效,要
求样本容量n大于解释变量个数p。当np
时,普通OLSE方法失效。
n与p比例
据英国统计学家M.Kendall,n应是p10
倍。这有时很难做到,但在收集数据时,应尽
可能多收集一些样本数据。;统计数据整理
统计数据整理中不仅要把一些变量数据
进行折算、差分,甚至把数据对数化、标准化
等,有时还须注意剔除个别特别大或特别小
“野值”。在统计数据质量不高时,经常会遇到
这种情况。当然,有时还须利用插值方法把
空缺数据补齐。;确定回归模型数学形式;经济回归模型建立,通常要依据经济理论与一些数理经济学结果。
有时,我们无法根据现有资料确定模型形式, 这时可以采用不同形式进行计算机模拟,对于不同模拟结果,选择较好一个做为理论模型。
尽管模型中待估未知参数要等到参数估计、检验之后才能确定,但在很多情况下,可根据实际问题对未知参数正负及大小范围事先给予确定。;模型参数估计;对于一元线性回归模型,在满足模型基本假定条件下,我们可以求得
;由上述计算结果,回归系数 波动不仅与随
机误差方差 有关,而且还与自变量x取值
离散程度有关。如果x取值比较分散,即x
波动较大,则 波动就小, 估计值 就
比较稳定。反之,若原始数据x是在一个较小
范围内取值,则 估计值稳定性就差。
而回归常数 方差也不仅与随机误差方差
与自变量x取值离散程度有关,而且还同样本
数据个数n有关。显然数据n越大时,方差越
小。;对于多元回归模型,也有类似结论。
为了使未知参数估计值更稳定,在收集数据时,就应该考虑x取值尽可能分散一些,不要挤在一块,样本量也应尽可能大一些,样本量n太小时,估计量稳定性肯定不会太好。;模型检验;回归方程显著F检验;回归系数显著性t检验; 由于某些自变量不显著,因而在多元回归中并不
是包含在回归方程中自变量越多越好,可采用逐步
回归方法,也可采用一种简单剔除多余变量方
法——后退法。
当有多个自变量对因变量y无显著性影响时,由于
自变量之间交互作用,不能一次剔除掉所有不显著
变量。原则上每次只剔除一个变量,先剔除其中t
绝对值最小(或P值最大)一个变量,然后再对
求得新回归方程进行检验,有不显著变
原创力文档

文档评论(0)